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图 灵 社 区 的 电子 书 没有 采用 专 有 客 
户 端 ， 您 可 以 在 任意 设备 上 ， 用 自 
己 喜 欢 的 浏览 器 和 PDF 阅读 器 进行 
阅读 。 

但 您 购买 的 电子 书 仅 供 您 个 人 使 用 ， 
未 经 授权 ， 不 得 进行 传播 。 

我 们 愿意 相信 读者 具有 这 样 的 良知 
和 觉悟 ， 与 我 们 共同 保护 知识 产权 。 


如 果 购 买 者 有 侵权 行为 ， 我 们 可 能 
对 该 用 户 实 施 包括 但 不 限于 关闭 该 
帐号 等 维权 措施 ， 并 可 能 追究 法 律 
责任 。 


1969 年 出 生 ， 著 有 《彻底 掌握 
C 语 言 》、《Java 之 这 和 陷阱 》、 
《自己 设计 编程 语言 》 等 。 其 一 针 
见 血 的 “毒舌 ” 文 久 和 对 编程 语言 
深刻 的 见地 受到 广大 读者 的 欢迎 。 





作者 主页 : 
http://kmaebashi.com/ 


13 年 编程 经 验 。 其 中 7 年 专注 
于 研发 基于 Java EE 和 .NET 的 开发 
框架 以 及 基于 UML 2.0 模 型 的 代码 
生成 工具 。 目 前 主要 关注 的 方向 
有 : Hadoop/NoSQL、HTML5、 
智能 手机 应 用 开发 等 。 














ER 图 灵 程 房 设 计 丛 书 





人 民 邮 电 出 版 社 


北京 


图 书 在 版 编目 (C I P ) 数据 








征服 C 指 针 / (日 ) 前 桥 和 弥 著 ; 吴 雅 明 译 . -- 北 
京 : 人 民 邮 电 出 版 社 ，2013. 2 (2016. 4 重印 ) 

(图 灵 程 序 设 计 从 书 ) 

ISBN 978-7-115-30121-5 




















1 ，Q@ 征 … I，@ 前 … @ 吴 … IIL，GDC 语 言 一 程序 设 
计 IV. WTP312 


中 国 版 本 图 书馆 CIP 数 据 核 字 (2012) 第 280432 号 








内 容 提 要 


本 书 被 称 为 日 本 最 有 营养 的 C 参考 书 。 作 者 是 日 本 若 名 的 “毒舌 程序 员 ”， 其 言辞 犀利 ， 观 点 鲜明 ， 
往往 能 让 读者 迅速 领悟 要 领 。 
书 中 结合 了 作者 多 年 的 编程 经 验 和 感悟 ， 从 C 语言 指针 的 概念 讲 起 ， 通 过 实验 一 步 一 步 地 为 我 们 解 
释 了 指针 和 数组 、 内 存 、 数 据 结构 的 关系 ， 展 现 了 指针 的 常见 用 法 ， 揭 示 了 各 种 使 用 技巧 。 另 外 ， 还 通 
过 独特 的 方式 教会 我 们 怎样 解读 C 语言 那些 让 人 “纠结 ”的 声明 语法 ， 如 何 绕 过 C 指针 的 陷阱 。 

本 书 适 合 C 语言 中 级 学 习 者 阅读 ， 也 可 作为 计算 机 专业 学 生 学 习 C 语言 的 参考 。 
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译 者 序 


在 平时 的 工作 中 ,我 时 常 遇 到 两 种 人 :一 种 是 刚 毕 业 的 新 人 , 问 他 们 :“ 以 前 学 过 C 语言 吗 ? ” 
他 们 大 多 目光 游离 , 极端 不 自信 地 回答 说 :“ 学 过 , 但 是 ……”; 另 一 种 是 做 过 几 年 C 语言 开发 并 
自我 感觉 良好 的 人 ,他 们 大 多 可 以 使 用 指针 熟练 地 操作 字符 数组 , 但 面 对 莱 鸟 们 提出 的 诸如 “为 
什么 数组 的 下 标 是 从 0 而 不 是 从 1 开始 ”这 类 “脑残 ”问题 时 ， 总 是 不 耐烦 地 回答 道 :“ 本 来 就 
是 这 样 嘛 。 这 是 常识 ， 你 记 住 了 就 行 !”( 可 本 来 为 什么 是 这 样 的 呢 ? ) 


本 书 的 作者 不 是 大 学 老师 , 更 不 是 那些 没有 写 过 儿 行 程序 的 学 究 , 而 是 一 位 至 今 还 工作 在 开 
发 一 线 的 程序 员 ( 在 国内 ,工作 了 5 年 的 你 如 果 还 在 做 “ 码 农 ", 青 定 会 坐立不安 了 吧 )。 他 带 给 
大 家 的 不 是 教科 书 中 死板 的 说 教 ， 而 是 十 多 年 经 验 沉淀 下 来 的 对 无 数 个 “脑残 ”问题 的 解答 。 在 
这 本 书 初版 面世 的 11 年 后 ,我 在 东京 一 个 大 型 书店 的 C 语言 类 别 的 书架 上 ， 依 然 还 能 看 见 这 本 
书 被 放 在 一 个 非常 醒目 并 且 触 手 可 及 的 位 置 上 。 


能 从 书架 上 挑 出 本 书 的 人 , 我 想 大 多 都 是 对 C 语言 指针 带 有 “ 式 惧 感 ”的 程序 员 吧 ! 其 实 所 
请 的 “ 怒 惧 感 ” 来 源 于 “困惑 "， 而 “困惑 ”又 来 自 于 “对 知识 点 不 够 透彻 的 理解 "。 作 者 运用 项 
默 风趣 并 且 不 失 犀 利 的 笔法 ,从 “究竟 什么 是 C 语 言 指 针 ” 开 始 , 通过 实验 一 步 一 步 地 为 我 们 解 
释 了 指针 和 数组 、 内 存 、 数 据 结构 的 关系 ， 以 及 指针 的 常用 手法 。 另 外 ， 还 通过 独特 的 方式 教会 
我 们 怎样 解读 C 语言 那些 让 人 “纠结 ”的 声明 语法 。 


带 着 学 习 的 态度 , 我 对 原著 的 每 一 个 章节 阅读 三 次 以 上 后 才 开始 动笔 翻译 。 每 次 阅读 我 都 会 
有 新 的 收获 ， 建 议 购 买 本 书 的 读者 不 要 读 了 一 遍 就 将 其 束之高阁 (甚至 一 遍 读 不 下 来 就 扔 到 一 
边 )。 隔 一 段 时 间 再 来 读 一 遍 ， 收 获 会 更 多 。 


在 翻译 的 过 程 中 , 我 身边 的 许多 人 给 了 我 莫大 的 支持 和 鼓励 。 我 的 同事 的 宋 岩 、 王 红 升 在 C 
语言 方面 都 具有 10 年 以 上 的 编程 经 验 ， 他 们 经 常 锁 牧 个 人 的 休息 时 间 帮 我 试 读 译 稿 ， 提 出 了 诸 
多 宝贵 的 意见 和 建议 。 开 始 翻 译 这 本 书 时 , 我 儿 易 好 刚 出 生 三 个 月 。 新 的 生命 改变 了 一 家 的 生活 
状态 , 带 给 我 们 更 多 的 是 感动 和 欢乐 。 妻子 葛 亚 文 在 我 翻译 本 书 的 期 间 默默 承受 了 产后 在 身体 上 
和 精神 上 的 巨大 压力 ， 这 不 是 一 句 感谢 能 够 回报 的 。 借 此 祝愿 一 家 一 一 四 季 有 隐 ， 岁 月 静 好 ! 


























































































































































































































吴 雅 明 
2012/11/26 ”于 北京 
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了 中 


这 是 一 本 关于 C 语 
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的 数组 和 指针 的 书 。 


后 




















一 定 有 很 多 人 感到 纳闷 :“ 都 哪 朝 哪 代 了 ， 还 出 版 C 语 言 的 书 。 
C 语言 确实 是 非常 陈 | 








方面 的 书籍 还 是 汗 牛 充 栋 的 ,其 中 专门 
吗 ? 这 才 是 最 应 该 质疑 的 吧 。 



































日 的 语言 ， 不 过 也 不 可 能 马上 放弃 对 它 的 使 用 。 至 少 在 书店 里 ，C 语言 
解 指针 的 书 也 有 很 多 。 既 然 如 此 , 还 有 必要 旧 瓶 装 新 酒 

但 是 , 每 当 我 看 到 那些 充斥 在 书店 里 的 C 语 言 

有 使 用 C 开发 过 大 规模 的 系统 。 当 然 ， 并 不 是 所 有 书 的 作者 都 这 样 。 

指名 i 

同 ， 


后 





























入 门 书 籍 , 总 会 怀疑 这 些 书 的 作者 以 前 根本 没 
被 认为 是 C 语言 中 最 大 的 难点 , 对 它 的 讲解 ,很 多 书 都 搞 得 像 教 科 书 一 样 ,， 叙述 风格 雷 
让 人 感觉 有 点 装 腔 作 势 。 就 连 那些 指针 的 练习 题 ， 其 中 的 说 明 也 让 人 厌倦 。 
能 够 炮 
者 。 特 别 是 面 对 那 些 在 封面 上 符 尝 正 正 地 印 上 “多 
更 加 强烈 。 


出 出 这样 的 书籍 , 我 想 一 般 都 得 归功 于 那些 连 自己 对 C 语言 语法 都 是 一 知 半 解 的 作 
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2 类 信息 处 理 考试 ”? 字 机 
本 书 。 





的 书 ， 这 种 感觉 





当 我 还 是 个 菜鸟 的 时 候 ， 也 曾 对 数组 和 指针 的 相关 语法 感到 非常 “纠结 


O 





正 是 抱 着 “要 是 那个 时 候 上 天 能 让 我 遇见 这 样 一 本 书 , 那 可 真 帮 了 大 由 





”的 想法 ,我 写 了 这 
本 书 的 内 容 ， 是 基于 我 很 入 以 前 ( 1998 年 7 月 ) 就 开始 在 网 上 公开 的 内 容 : 
“深入 学 习 数 组 和 指针 ” 


http://kmaebashi.com/programmer/pointer.html 














志 / 


“ 当 我 傻 呀 ”既然 可 以 在 网 上 阅读 , 我 干 嘛 还 买 你 的 书 ?” 我 想 对 有 此 想法 的 人 说 :“ 我 敢 打 
包 票 ， 绝 不 会 让 你 吃亏 的 ， 请 放心 地 拿 着 这 本 书 去 收 
@ 日 本 国内 关 








于 计算 机 信息 处 理 方 盏 








or A、 
球台 名 


的 考试 ，3 












































吉 账 吧 1” 因 为 此 书 在 出 版 过 程 中 追加 
向 计算 机 系统 开发 、 维护 、 运 














领域 的 初级 技术 人 员 。 











了 大 量 的 文字 和 插图 ， 实 际 上 已 经 比 网 上 公开 的 内 容 丰 富 了 许多 。 
另外 ， 在 阅读 本 书 的 过 程 中 ， 请 留心 以 下 几 点 。 


口 本 书 的 读者 群 虽然 定位 于 “学 习 过 C 语言 ， 但 是 在 指针 的 运用 上 遇 到 困难 ”的 读者 ， 但 

还 是 能 随处 可 见 一 些 高 难度 的 内 容 。 那 是 因为 我 也 不 能 免 俗 ， 偶 尔 也 喜欢 把 自己 掌握 的 
知识 拿 出 来 显摆 一 下 。 
对 于 初学 者 ， 你 完全 没有 必要 从 头 开始 阅读 。 遇 到 还 不 太 明 日 的 地 方 ， 也 不 要 过 分 纠结 。 
阅读 中 可 以 跳跃 章节。 对 于 第 0 章 和 第 1 章 ， 最 好 还 是 按 顺 序 阅 读 。 如 果 认 为 第 2 章 有 点 
难度 ,你 可 以 先 去 哺 第 3 章 。 如 果 第 3 章 也 不 懂 , 不妨 尝 试 先 去 阅读 第 4 章 。 这 种 阅读 方 
式 是 本 书 最 大 的 卖点 。 


口 在 本 书 中 ， 我 会 经 常 指出 一 些 “C 的 问题 点 ”和 “C 的 不 足 ”。 可 能 会 有 一 些 读者 认为 我 
比较 讨厌 C 语言 。 恰 恰 相 反 ， 我 认为 C 是 一 门 伟大 的 开发 语言 。 倒 不 是 因为 有 “情人 眼 
里 出 西施 ”"、“ 能 干 的 坏 小 子 也 可 爱 ” 这 样 的 理由 ， 毕 竞 在 开发 现场 那些 常年 被 使 用 的 语 
言 中 , C 语 言 还 是 有 相当 实力 的 。 就 算是 长 得 不 太 帅 , 但 论 才干 ， 那 也 是 “开发 现场 的 老 
油条 ”了 。 
所 以 ， 因 阅读 本 书 而 开始 抱怨 “C 语言 真是 很 差劲 ”的 读者 ， 你 即使 计划 了 什么 “去 接 
Dennis Ritchie" 之 旅 "， 我 也 不 会 去 参加 的 。 如 果 有 “去 接 James Gosling” 之 旅 "， 那 还 是 
有 点 心动 的 。 哈 ， 还 是 算 了 吧 ， 得 过 且 过 就 行 啦 。 


在 本 书 的 写作 过 程 中 ,我 得 到 了 很 多 人 的 帮助 。 


繁忙 之 中 阅读 大 量 原 稿 并 指出 很 多 错误 的 泽 田 大 浦 先 生 、 山 口 修 先 生 、 桃 井 康 成 先生 ,指出 
本 书 网 上 公开 内 容 的 错误 的 人 们 , 还 有 那些 受到 发 布 在 公司 内 部 的 内 容 的 影响 而 沦 为 “实验 小 日 
鼠 ” 的 人 们 ， 以 及 通过 和 .com.lang.c 和 各 种 邮件 列表 进行 讨论 并 且 提 供 各 种 信息 的 人 们 ， 正 是 因 
为 你 们 ， 本 书 的 内 容 才 能 更 加 可 靠 。 当 然 ， 遗 留 的 错误 由 我 来 承担 所 有 责任 。 


发 现 我 的 网 页 , 并 给 予 出 版 机 会 的 技术 评论 社 的 熊谷 裕 美 子 小 姐 , 还 有 给 予 初次 写 书 的 我 很 
多 指导 的 编辑 高 桥 阳 先生 ， 如 果 没 有 他 们 的 大 力 协助 ， 这 本 书 是 不 可 能 诞生 的 。 


在 这 里 ,我 并 向 他 们 致 以 深 深 的 谢意 。 





































































































































































































2000 年 11 月 28 日 03:33J.S.T. 


前 桥 和 弥 





GDC 语 言 之 父 。 本 书 中 对 他 做 了 介绍 。 
@ Java 语言 之 父 。 
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0.1 本 书 的 目标 

















在 C 语 言 的 学 习 中 ， 指 针 的 运用 被 认为 是 最 大 的 难关 。 
关于 指针 的 学 习 ， 我 们 经 常 听 到 下 面 这 样 的 建议 : 
“如 果 理 解 了 计算 机 的 内 存 和 地 址 等 概念 ， 指 针 什么 的 就 简单 


二 六 
“因为 C 是 低级 语言 ， 所 以 先 学 


果真 如 此 吗 ? 











习 汇 编 语言 比较 好 。” 








正如 那些 C 语言 入门 书籍 中 提 到 的 那样 ， 变 量 被 保存 在 内 存 的 “ 某 个 地 


方 "。 为 了 标记 变量 在 内 存 中 的 具体 场所 
编号 (地 址 )。 因 此 ， 大 多 数 运行 环境 中 
量 地 址 的 变量 。 























到 此 为 止 的 说 明 ， 所 有 人 都 应 该 觉得 很 简单 吧 。 


，C 语言 在 内 存 中 给 这 些 场所 分 配 了 
， 所 谓 的 “指针 变量 ”就 是 指 保存 变 
























































理解 “指针 就 是 地 址 ”， 可 能 是 指针 学 习 的 必要 条 件 ， 但 不 是 充分 条 件 。 


现在 ， 我 们 只 不 过 刚刚 迈 出 了 “万 里 长 生 


见 




















如 果 双 
下 困惑 。 


FE 的 第 一 步 ”。 





L 察 一 下 菜鸟 们 实际 使 用 C 指针 的 过 程 ， 就 会 发 现 他 们 往往 会 有 如 





口 声明 指针 变量 int *a;…… 到 这 里 还 挺 像样 的 ， 可 是 当 将 这 个 变量 作 
为 指针 使 用 时 ， 依 然 翡 剧 地 写成 了 *a。 
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口 给 出 int &a; 这 样 的 声明 ( 这 里 不 是 指 C++ 编程 )。 

口 啥 是 “指向 int 的 指针 ”? 不 是 说 指针 就 是 地 址 吗 ? 怎么 还 有 “指向 

int 的 指针 ”,“ 指 向 char 的 指针 ”， 难 到 它们 还 有 什么 不 同 吗 ? 

口 当 学 习 到 “给 指针 加 1， 指 针 会 前 进 2 个 字 节 或 者 4 个 字 节 ”时 ,你 可 
能 会 有 这 种 疑问 :“ 不 是 说 指针 是 地 址 吗 ?” 这 种 情况 下 , 难道 指针 不 应 
该 是 前 进 1 个 字 节 吗 ? ” 

DO scanf() 中 ， 在 使 用 %d 的 情况 下 ， 变 量 之 前 需要 加 上 & 才 能 进行 传递 。 

为 什么 在 使 用 %s 的 时 候 ， 就 可 以 不 加 &? 

口 学 习 到 将 数组 名 赋 给 指针 的 时 候 ， 将 指针 和 数组 完全 混为一谈 ， 犯 下 
“将 没有 分 配 内 存 区 域 的 指针 当做 数组 进行 访问 ”或 者 “将 指针 赋 给 数 
组 ”这 样 的 错误 。 

出 现 以 上 混乱 的 情形 ， 并 不 是 因为 没有 理解 “指针 就 是 地 址 ”这 样 的 概 

念 。 其 实 ， 真 正 导 演 这 些 悲 剧 的 幕后 黑手 是 : 


口 C 语 言 奇怪 的 语法 
口 数组 和 指针 之 间 微 妙 的 兼容 性 


某 些 有 一 定 经 验 的 C 程序 员 会 觉得 C 的 声明 还 是 比较 奇怪 的 。 当 然 也 有 
一 些 人 可 能 并 没有 这 种 体会 ， 但 或 多 或 少 都 有 过 下 面 的 疑问 。 


口 C 的 声明 中 ，[] 比 * 的 优先 级 高 。 因 此 ，char *s[10] 这 样 的 声明 意 为 
“指向 char 的 指针 的 数组 ” 搞 反 了 吧 ? 
口 搞 不 明白 double (xp) [3]; 和 void (xfunc) (int a) ;这样 的 声明 到 
底 应 该 怎样 阅读 。 

口 int xa 中 ,声明 a 为 “指向 int 的 指针 ”。 可 是 表达 式 中 的 指针 变量 
前 * 却 代表 其 他 意思 。 明 明 是 同样 的 符号 ， 意 义 为 什么 不 同 ? 

口 int xa 和 int a[] 在 什么 情况 下 可 以 互 换 ? 

口 空 的 口 可 以 在 什么 地 方 使 用 ， 它 又 代表 什么 意思 呢 ? 


本 书 的 编写 就 是 为 了 回答 以 上 这 样 的 问题 。 


很 坦白 地 说 ,我 也 是 在 使 用 了 C 语言 好 儿 年 之 后 ， 才 对 C 的 声明 语法 大 
彻 大 悟 的 


世间 的 人 们 大 多 不 愿意 承认 自己 比 别 人 愚 策 , 所 以 总 是 习惯 性 地 认为 “ 实 
际 上 只 有 极 少 的 人 才能 够 精通 C 语 言 指针 ”, 以 此 安 感 一 下 自己 那 颗 脆弱 的 心 。 


例如 ， 你 知道 下 面 的 事实 吗 ? 


































































































































































































0.2 目标 读者 和 内 容 结 构 
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口 在 引用 数组 中 的 元 素 时 ， 其 实 a[ 订 中 的 口 和 数组 毫 无 关系 。 
口 C 里 面 不 存在 多 维 数组 。 


如 果 你 在 书店 里 拿 起 这 本 书 ， 翻 看 几 页 后 心 想 :“ 什 么 呀 ? 简直 是 奇谈 怪 
论 !” 然 后 照 原样 把 书 轻 轻 地 放 回 书架 。 那 么 你 恰恰 需要 阅读 这 本 书 。 


有 人 说 :“ 因 为 C 语 言 是 模仿 汇编 语言 的 ， 要 想 理解 指针 ， 就 必须 理解 内 
存 和 地 址 等 概念 。” 你 可 能 会 认为 : 


“指针 ”是 C 语 言 所 特有 的 、 底 层 而 肪 恶 的 功能 。 


其 实 并 不 是 这 样 的 。 确 实 ,“C 指针 ”有 着 底层 而 邪恶 的 一 面 ， 但是， 它 
又 是 构造 链表 和 树 等 “数据 结构 ”不 可 缺少 的 概念 。 如 果 没 有 指针 ， 我 们 是 
做 不 出 像样 的 应 用 程序 的 。 所 以 ， 几 是 真正 成 熟 的 开发 语言 ， 必 定 会 存在 指 
针 ， 如 Pascal、Delphi、Lisp 和 Smalltalk 等 ， 就 连 Visual Basic 也 存在 指针 。 
早期 的 Perl 因为 没有 指针 而 饱 受 批评 ， 从 版 本 5 开始 也 引入 了 指针 的 概念 。 
当然 ，Java 也 是 有 指针 的 。 很 遗憾 ， 世 上 好 像 对 此 还 存 有 根深 带 固 的 误解 。 


在 本 书 中 ， 我 们 将 体验 如 何 将 指针 真正 地 用 于 构造 数据 结构 。 
“指针 ”是 成 熟 的 编程 语言 必须 具有 的 概念 。 


尽管 如 此 ， 为 什么 C 的 指针 却 让 人 感觉 格外 地 纠结 呢 ? 理由 就 是 ，C 语 
言 混乱 的 语法 ， 以 及 指针 和 数组 之 间 奇 怪 的 兼容 性 。 


本 书 旨 在 阐明 C 语言 混乱 的 语法 ， 不 但 讲解 了 “C 特有 的 指针 用 法 ”， 还 
针对 和 其 他 语言 共有 的 “普遍 的 指针 用 法 ”进行 了 论述 。 


下 面 ， 让 我 们 来 看 一 下 本 书 的 具体 结构 。 


0.2 目标 读者 和 内 容 结 构 


本 书 的 目标 读者 为 : 


口 粗略 地 读 过 C 语 言 的 入 门 书籍 ,但 还 是 对 指针 不 太 理 解 的 人 
口 平时 能 自如 地 使 用 C 语言， 但 实际 对 指针 理解 还 不 够 深入 的 人 


本 书 由 以 下 内 容 构成 。 


口 第 1 童 : 从 基础 开始 
口 第 2 章 : 做 个 实验 见 分 晓 













































































































































































预备 知识 和 复习 
C 是 怎样 使 用 内 存 的 











4 第 0 章 本 书 的 目标 与 结构 





引言 

















口 第 3 章 : 揭秘 C 的 语法 一 一 它 到 底 是 怎么 回 事 














口 第 4 章 : 数组 和 指针 的 常用 用 法 
口 第 5 章 : 数据 结构 一 一 真正 的 指针 的 使 用 方法 
口 第 6 章 : 其 他 一 一 拾遗 








第 1 章 和 第 2 章 主要 面向 初学 者 。 从 第 3 章 开始 的 内 容 , 是 为 那些 已 经 具 
备 一 定 经 验 的 程序 员 或 者 已 经 读 完 第 1 章 的 初学 者 准备 的 。 


面向 初学 者 ， 第 1 章 和 第 2 章 从 “指针 就 是 地 址 ”这 个 观点 开始 讲解 。 


通过 printfQ) 来 “亲眼 目睹 ”地 址 的 实际 值 ， 应 该 说 ， 这 不 失 为 理解 指 
针 的 一 个 非常 简单 有 效 的 方式 。 


对 于 那些 “尝试 学 习 了 C 语言 ， 但 是 对 指针 还 不 太 理 解 ” 的 人 来 说 ， 通 
过 自己 的 机 器 实际 地 输出 指针 的 值 ， 可 以 相对 简单 地 领会 指针 的 概念 。 


首先 , 在 第 1 章 里 , 针对 C 语 言 的 发 展 过 程 (也 就 是 说 , C 是 怎样 “ 沦 为 ” 
让 人 如 此 县 惧 的 编程 语言 的 )、 指 针 以 及 数组 进行 说 明 。 


对 于 指针 和 数组 的 相互 关系 ， 市 面 上 多 数 的 C 语言 人 门 书 籍 只 是 含混 其 
* K&R 被 称 为 C 语言 的 “” 秤 地 做 了 敷衍 解释 (包括 K&R*， 我 认为 该 书 是 诸 恶 之 源 )。 这 还 不 算 ， 他 们 
宝典 (中文 版 叫 《C 程 ”还 将 本 来 已 经 用 数组 写 好 的 程序 ， 特 地 用 指针 运算 的 方式 重新 编写 ， 还 说 什 


序 设计 语言 (第 2 入“ 这样 才 像 C 语言 的 风格 ”。 
版 .新 版 )》)， 在 后 面 



























































我 们 会 提 及 这 本 书 的 像 C 语言 的 风格 ? 也 许 是 可 以 这 么 说 ， 但 是 以 此 为 由 炮制 出 来 
背景 。 此 书 的 作者 之 一 的 难 懂 的 写法 ， 到 底 好 在 哪里 ? 哦 ? 执行 效率 高 ? 为 什么 ? 这 是 真 
就 是 C 语言 之 父 的 吗 ? 

Dennis Ritchie 本 人 。 


产生 这 些 疑 问 是 正常 的 ， 并 且 ， 这 么 想 是 正确 的 。 


了 解 C 语 言 的 发 展 过 程 ， 就 能 理解 C 为 什么 会 有 “指针 运算 ”等 这 样 奇 
怪 的 功能 。 


第 1 章 中 接 下 来 的 内 容 也 许 会 让 初学 者 纠结 ， 因 为 我 们 将 开始 接触 到 数 
组 和 指针 的 那些 容易 让 人 混淆 的 语法 。 


第 2 章 讲 解 了 C 语言 实际 上 是 怎样 使 用 内 存 的 。 


在 这 里 同样 采用 直观 的 方式 将 地 址 输出 。 请 有 C 运行 环境 的 读者 一 定 亲 
手 输入 例 程 的 代码 ， 并 且 尝 试 运行 。 


对 于 普通 的 局 部 变量 、 艺 数 的 参数 、static 变量 、 全 局 变量 及 字符 串 常 
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量 (使 用 " "包围 的 字符 串 ) 等 ， 知 晓 它们 在 内 存 中 实际 的 保存 方式 ， 就 可 以 
洞察 到 C 语言 的 各 种 行为 。 


遗憾 的 是 ， 几 乎 所 有 使 用 C 语言 开发 的 程序 ， 运 行 时 检查 都 不 是 非常 严 
密 。 一 旦 出 现 诸如 数组 越界 操作 ， 就 会 马上 引起 “内 存 区 域 破坏 ”之 类 的 错 
误 。 虽 然 很 难 将 这 些 bug 完全 消灭 ， 但 明白 了 C 如 何 使 用 内 存 之 后 ， 至 少 可 
以 在 某 种 程度 上 预防 这 些 bug 的 出 现 。 


第 3 章 讲解 了 与 数组 和 指针 相关 的 C 语言 语法 。 

虽然 我 多 次 提 到 “究竟 指针 为 什么 这 么 难 "， 但 是 对 于 “指针 就 是 地 址 ” 
这 个 观点 ， 在 理解 上 倒是 非常 简单 。 出 现 这 种 现象 ， 其 实 缘 于 C 语言 的 数组 
和 指针 的 语法 比较 混乱 。 

乍 看 上 去 ，C 语 言 的 语法 比较 严谨 ， 实 际 上 也 存在 很 多 例外 。 

对 于 那些 平时 和 我 们 朝夕 相处 的 语法 ， 究 竟 应 套用 哪 条 规则 ? 还 有 ， 哪 
些 语 法 需要 特殊 对 待 ” 关 于 这 些 ， 第 3 章 里 会 做 彻底 的 讲解 。 

那些 自 认 为 是 老 鸟 的 读者 ， 可 以 单独 拿 出 第 3 章 来 读 一 读 ， 看 看 自己 以 
前 是 如 何 上 当 的 。 
第 4 章 是 实践 篇 ,举例 说 明 数 组 和 指针 的 常用 用 法 。 如 果 读 者 理解 了 这 部 
分 内 容 ， 对 付 大 部 分 程序 应 该 不 在 话 下 。 

老实 说 ， 对 于 已 经 将 C 语言 使 用 得 像 模 像 样 的 读者 来 说 ， 第 4 章 中 举 出 
的 例子 并 没有 什么 新 意 。 但 是 ， 其 实 有 些 人 对 这 些 语法 只 是 一 知 半 解 ， 很 多 
时 候 只 不 过 是 依照 以 前 的 代码 “ 照 猫 画 虎 ” 黑 了 。 

阅读 完 第 3 章 后 去 读 第 4 章 , 对 于 那些 已 经 能 够 熟练 使 用 的 写法 , 你 也 会 
惊 呼 一 声 :“ 原 来 是 这 个 意思 啊 !1” 
第 5 章 中 ， 解 说 指针 真正 的 用 法 一 一 数据 结构 的 基本 知识 。 

前 四 章 中 的 例子 ， 都 是 围绕 C 语言 展开 的 。 第 5 章 里 则 会 涉及 其 他 语言 
的 指针 。 

无 论 使 用 哪 种 语言 编程 ，“ 数 据 结 构 ” 都 是 最 重要 的 。 使 用 C 语言 来 构造 
数据 结构 的 时 候 ， 结 构 体 和 指针 功 不 可 没 。 

“不 仅仅 对 于 C 语 言 的 指针 ， 连 结构 体 也 不 太 明 白 ” 的 读者 ,务必 不 要 错 
过 第 5 章 。 
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第 0 章 本 书 的 目标 与 结构 





| 言 


已 





第 6 章 中 , 对 到 此 为 止 还 没有 覆盖 到 的 知识 进行 拾遗 ,并 且 为 大 家 展示 一 
些 可 能 会 遇 到 的 陷阱 以 及 惯用 语法 。 
和 类 似 的 书籍 相 比 ， 本 书 更 加 注重 语法 的 细节 。 








提起 语法 ,就 有 “日 本 的 英语 教育 不 偏重 语法 ”， 以 至 于 给 人 “就 算 不 明 
白 也 没有 什么 ”的 印象 。 确实 是 这 样 , 我们 早 在 不 懂 “ 雪 行 ” 怎 样 变形 之 前 ， 
就 已 经 会 说 日 语 了 。 


但 是 ，C 语言 可 不 是 像 日 语 那样 复杂 的 自然 语言 ， 它 是 一 门 编程 语言 。 


单纯 地 通过 语法 来 解释 自然 语言 是 非常 困难 的 。 比 如 ,日语 “VW\ 密 大 区 
0 持 妨 之 ”， 利 用 假名 汉字 变换 程序 只 能 变换 成 “ 渡 所 万世 中 导 茶 ”( 中 文 意 
思 是 “ 湖 好 的 茶 " )， 尽 管 如 此 ， 同 样 通过 假名 变换 程序 ，“V\ 和 大 区 全 V、 
羽 石 完 ” 竟 然 也 可 以 变换 成 “入 和 宙 关 手中 厚 V\ 书 茶 ” ( 中文 意 思 是 “ 湖 好 的 
热 腾 腾 的 茶 ' ) "。 编 程 语言 最 终 还 是 通过 人 类 制订 的 语法 构成 的 ， 它 要 做 到 
让 编译 器 这 样 的 程序 能 够 解释 。 


“反正 大 家 都 是 这 么 写 ， 我 也 这 么 写 ， 程 序 就 能 跑 起 来 。 





























































































































我 希望 不 仅 是 初学 者 ,那些 已 经 积累 了 一 定 经 验 的 程序 员 也 能 阅读 本 书 。 
通过 深入 理解 C 的 语法 ， 可 以 让 我 们 真正 领会 直到 今天 还 像 “ 口 头 禅 ” 一 样 
使 用 的 那些 程序 惯用 写法 。 


无 论 如 何 ， 让 我 们 做 到 “ 知 其 然 知 其 所 以 然 "， 这 样 有 利 心理 健康 ， 不 
是 吗 ? 





























@ 中 文 里 也 有 类 似 的 例子 ， 如 : 他 是 先知 。 一 他 是 先知 道 那 件 事 的 人 。 一 一 译 者 注 








Vdd 


一 


下 
从 基础 开始 一 一 预备 知识 和 复习 


1.1 CC 是 什么 样 的 语言 


1.1.1 比喻 


在 Donald C. Gause 和 Gerald M. Weinberg 合 著 的 《你 的 灯亮 着 吗 ? 》 癌 
一 书 中， 有 这样 一 节 (根据 需要 ， 我 做 了 必要 的 删 减 )。 


某 计 算 机 制造 商 开 发 了 一 种 新 型 打印 机 。 

技术 小 组 在 如 何 保 证 打印 精度 的 问题 上 非常 苦恼 ， 每 次 进行 新 
的 测试 时 ， 工 程 师 都 不 得 不 花 很 长 的 时 间 测 量 打印 机 的 输出 结果 来 
追求 精确 性 

丹 ( Dan Daring ) 是 这 个 小 组 中 最 年 轻 但 或 许 是 最 聪明 的 工程 师 。 
他 发 明了 一 种 工具 ， 即 每 隔 8 英寸 就 在 铝 条 上 误 上 小 针 。 使 用 这 个 
工具 ， 可 以 很 快 地 找到 打印 机 输出 位 置 的 误差 。 

这 个 发 明显 著 地 提高 了 生产 效率 ， 丹 的 上 司 非 常 高 兴 ， 提 议 给 
丹 颁 发 一 个 公司 的 特别 奖赏 。 他 从 车 间 里 拿 了 这 个 工具 ， 带 回 办 公 
室 ， 这 样 他 写 报告 的 时 候 还 可 以 仔细 地 研究 一 下 。 

这 个 上 司 显然 还 用 不 惯 这 个 工具 ， 当 他 把 这 个 工具 放 在 桌子 上 
的 时 候 ， 将 针尖 朝 上 了 。 更 不 幸 的 是 ， 当 丹 的 上 司 的 上 司 友 好 地 坐 
到 桌 角 上 ， 打 算 谈 谈 给 丹 颁 发 奖励 时 ， 部 门 内 的 所 有 人 都 听 到 了 他 
痛苦 的 拓 叫 声 一 一 他 的 屁股 上 被 扎 了 两 个 相距 8 英寸 的 孔 。 








C 语言 就 恰 如 这 个 工具 。 也 就 是 说 ， 它 是 一 门 


# 这 本 书 的 副标题 为 “发 
现 问 题 的 真正 所 在 ”， 
它 通过 一 些 趣闻 轶 事 
来 告诉 世人 “不 要 急于 
寻找 问题 的 答案 ,而 是 


问题 是 什么 "。 
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* 现在 已 经 不 存在 的 
DEC (美国 数字 设备 公 
司 ) 生产 的 微型 电脑 。 





口 为 了 解决 眼前 问题 ， 由 开发 现场 的 人 发 明 的 ， 
口 虽然 使 用 方便 ， 
口 但 看 上 去 不 怎么 顺眼 ， 

口 如 果 不 熟悉 的 人 糊 里 糊涂 地 使 用 了 它 ， 难 免 会 带 来 “悲剧 ”的 语言 。 

















1.1.2 C 的 发 展 历 程 


众所周知 ，C 原本 是 为 了 开发 UNIX 操作 系统 而 设计 的 语言 。 


如 此 说 来 ， 好 像 C 应 该 比 UNIX 更 早 问 世 ， 可 惜 事实 并 非 如 此 ， 最 早 的 
UNIX 是 用 汇编 来 写 的 。 


因为 厌倦 了 总 是 理 哈 哈 地 使 用 汇编 语言 进行 编程 ，UNIX 的 开发 者 Ken 
Tompson 开发 了 一 种 称 为 “B” 的 语言 。B 语言 是 1967 年 剑桥 大 学 的 Martin 
Richard 开发 的 BCPL (Basic CPL ) 的 精简 版 本 。BCPL 的 前 身 是 1963 年 剑 
桥 大 学 和 伦敦 大 学 共同 研究 开发 的 CPL ( Combined Programming Lanugage ) 
语言 。 

B 语言 不 直接 生成 机 器 码 ， 而 是 由 编译 器 生成 栈 式 机 ( Stack Machine ) 用 
的 中 间 代 码 ， 中 间 代 码 通过 解释 器 ( interpreter ) 执行 (类似 Java 和 早期 的 
Pascal )。 因 此 ，B 语言 的 执行 效率 非常 低 , 结果 ,在 后 来 的 UNIX 开发 过 程 中 
人 们 放弃 了 使 用 B 语 言 。 

在 这 之 后 的 1971 年 , Ken Tompson 的 同事 Dennis Ritchie 对 B 语 言 做 了 改 
良 ， 追 加 了 char 数据 类 型 ， 并且 让 B 语言 可 以 直接 生成 PDP-11 的 机 器 代码 。 
经 在 很 短 的 时 间 内 ， 大 家 将 这 门 语言 称 为 NB (New B )。 

之 后 ，NB 改称 为 C 语 言 一 一 这 就 是 C 语 言 的 诞生 。 


后 来 , 主要 是 为 了 满足 使 用 UNIX 的 程序 员 的 需要 , C 语言 一 边 接受 来 自 
各 方面 的 建议 ， 一 边 摸 着 石头 过 河 般 地 进行 着 周而复始 的 功能 扩展 。 


1978 年 出 版 了 被 称 为 C 语 言 宝典 的 The C Programming Language 一 书 。 











































































































此 书 取 了 两 位 作者 〈Brian Kernighan 和 Dennis Ritchie ) 的 姓氏 首 字母 ， 
简称 为 K&R。 在 后 面 提 到 的 ANSI 标准 制定 之 前 ， 此 书 一 直 作 为 C 语言 语法 
的 参考 书 被 人 们 广泛 使 用 。 


听 说 这 本 书 在 最 初 发 行 的 时 候 ，Prentice-Hall 出 版 社 制 订 了 对 于 当时 存在 
的 130 个 UNIX 站 点 平均 每 个 能 卖 9 本 的 销售 计划 ( 相 比 Lif With UNIXt?] )。 














1.1 C 有 是 什么 样 的 语言 9 

















当然 了 ， 哪 怕 是 初版 K&R 的 销售 量 ， 也 以 3 位 数 的 数量 级 超过 了 
Prentice-Hall 出 版 社 最 初 的 销售 计划 。 原 本 只 是 像 “ 丹 的 工具 ”一 样 为 了 满足 
自用 的 C 语 言 ， 历 经 坎坷 ， 最 终 成 为 全 世界 广泛 使 用 的 开发 语言 。 


补 
TY 充 B 是 什么 样 的 语言 ? 


在 C 语 言 的 入 门 书籍 中 ， 经 常 提 到 C 有 是 也 语言 的 进化 版 本 。 但 几乎 所 
有 的 书 对 B 语言 的 介绍 都 只 有 这 么 多 ,没有 具体 说 明 也 语言 究竟 是 一 门 什 
么 样 的 语言 。 

正如 前 面 描 述 的 那样 ，B 是 在 虚拟 机 上 运行 的 、 解 释 型 开发 语言 。 
B 语言 没有 像 Java 那样 想 要 去 实现 “到 处 运行 ”的 宏伟 目标 ， 它 只 是 因为 
当时 运行 UNIX 的 PDP-7 硬件 环境 的 限制 ,而 只 能 采用 解释 器 这 样 的 实现 
7 

了 B 是 “没有 类 型 ”的 语言 。 虽 然 C 里 面 有 char、short、int、float 
和 double 等 很 多 的 数据 类 型 ， 但 是 也 使 用 的 类 型 只 有 word (你 可 以 认为 
和 int 差不多 ),。 作为 本 书 的 主题 间 针 ， 在 也 里 面 和 整数 一 样 使 用 。 因 
为 无 论 怎么 说 ， 指 针 无 非 就 是 内 存 中 的 地 址 ， 对 于 机 器 来 说 ， 它 是 可 以 和 
整 型 同样 对 待 的 (关于 这 点 ， 在 本 章 中 会 详细 说 明 )。 

NB 是 具有 类 型 概念 的 语言 。 为 了 把 指针 和 整数 纠葛 不 清 的 B 移植 到 
NB，Dennis Ritchie 在 指针 运用 的 设计 上 下 了 很 大 的 工夫 。C 的 指针 让 人 感 
觉 很 难 理解 ， 可 能 也 有 这 方面 的 原因 。 

关于 B 语 言 ， 如 果 你 想 知 道 更 详细 的 内 容 ， 可 以 浏览 Dennis Ritchie 的 
网 页 :http://cm.bell-labs.com/cm/cs/who/dmr/index.html 中 的 “Users’ Reference 
toB” 等 内 容 。 





















































1.1.3 不 完备 和 不 统一 的 语法 
C 语 言 是 开发 现场 的 人 们 根据 自身 的 需要 开发 出 来 的 语言 ,所 以 具备 极 高 
的 实用 性 。 但 反 过 来 从 人 类 工程 学 的 角度 来 看 ， 它 就 不 是 那么 完美 了 。 
比如 : 
if (a = 5) { 一 一 本 来 应 该 写成 == 的 地 方 却 写成 了 = 
相信 大 家 都 犯 过 这 样 的 错误 吧 。 
在 日 语 键 盘 上 ,“-” 和 “=” 在 同一 按键 上 ， 因此 经 常会 发 生 下 面 的 问题 : 
































x* 我 手头 这 本 K&R 是 在 
1997 年 5 月 1 日 出 版 
的 第 二 版 (翻译 修订 
版 )， 已 经 是 第 211 次 
印刷 了 。 这 个 行业 的 图 
书 能 有 这 样 的 业绩 , 确 
实 惊人 。 
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六 尽管 如 此 ……… 假设 无 视 
了 有 返回 值 的 函数 返 
回 的 值 ，lint 会 给 出 一 
个 警告 。 为 了 消除 这 个 
讨厌 的 警告 ， 你 特地 使 
用 (void)printf(...) 
打印 返回 的 值 ,这 么 干 
是 不 是 就 有 点 过 了 ? 
C 原本 就 是 “本 性 恶 
劣 ”的 语言 , 获 告 级 别 
过 高 ,会 否定 一 些 既 存 
的 程序 写法 ,反而 带 来 
不 好 的 后 果 。 此 外 ,如 
果 最 大 限度 地 提高 警 
告 级 别 , 有 些 应 用 程序 
自身 包含 的 头 文件 也 
会 引起 警告 。 总 之 ， 
这 些 问 题 还 是 比较 麻 
烦 的 。 





for (i - 0; i < 100; i++) 一 一 忘 了 和 [shift]j] 键 一 起 按 下 

就 连 这 样 的 错误 ， 编 译 恬 也 往往 无 法 察觉 。 现 在 的 编译 器 倒是 可 以 给 出 
警告 ， 可 是 早期 的 编译 器 对 这 样 的 错误 是 完全 忽略 的 。 

使 用 switch case 的 时 候 ， 也 经 常 发 生 忘 了 写 break 的 错误 。 

幸运 的 是 ， 如 今 的 编译 需 ， 对 于 容易 犯 的 语法 错误 ， 在 很 多 地 方 可 以 给 
我 们 警告 提示 。 因 此 ， 不 但 不 能 无 视 这 些 编译 器 的 警告 ， 相 反应 该 提高 编译 
器 的 警告 级 别 ， 让 编译 器 替 我 们 指出 尽 可 能 多 的 错误 。 

换 句 话说 ， 如 果 编 译 右 向 我 们 提示 错误 或 者 警告 ,不 应 该 以 怨 报 德 :“ 什 
么 呀 ， 这 个 混蛋 !” 相 反应 该 奉 上 一 句 感 谢 :“ 谢 谢 你 ， 编 译 絮 先生 !” 然 后 去 
认真 地 清除 眼前 的 bug。 

要 点 
提高 编译 器 的 警告 级 别 。 
不 可 无 视 或 者 制止 编译 器 的 警告 。 


C 语 言 是 在 使 用 中 成 长 起 来 的 语言 。 因 此 ,由 于 很 多 历史 原因 遗留 了 一 些 
“奇怪 的 ”问题 。 具 有 代表 性 的 有 位 运算 符 “&” 和 “|” 的 优先 顺序 问题 。 
通常 ， 如 “==” 的 比较 运算 符 的 优先 级 要 低 于 那些 做 计算 的 运算 符 。 因 此 ， 
if (a< b + 3) 
这 样 的 条 件 表达 式 中 ， 虽 然 可 以 不 使 用 括号 来 写 ， 但 是 当 使 用 了 位 运算 符 的 
时 候 ， 就 行 不 通 了 。 
想 要 进行 “将 a 和 MASK 进行 按 位 与 运算 后 的 结果 , 再 和 b 做 比较 运算 ”， 
if (a & MASK == b) 
按照 上 面 的 写法 ， 因 为 & 运 算 符 的 优先 级 低 于 == 运 算 符 ， 所 以 被 解释 成 了 下 面 
这 样 : 
if (a & (MASK == b)) 
这 是 因为 在 没有 “&&” 和 “1 上 






































































































































运算 符 的 时 代 ， 使 用 “&” 和 “1” 来 代 








蔡 而 留 下 的 后 遗 症 。 
1.1.4 ANSI C 





即使 在 K&R 出 版 之 后 ，C 仍 在 不 断 地 扩展 。 
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比如 关于 结构 体 的 一 次 性 赋值 ， 在 K&R 的 初版 里 面 并 没有 记述 ， 其 实 这 
个 功能 在 K&R 出 版 之 前 ， 就 已 经 在 Dennis Ritchie 的 C 编译 器 里 实现 了 。 从 
某 种 意义 上 来 说 ，K&R 的 第 一 版 刚 出 版 就 已 经 过 时 了 。 这 在 计算 机 图 书 界 是 
常 有 的 事 。 


另外 ，K&R 的 记述 也 不 一 定 就 是 严密 的 ， 由 于 运行 环境 的 不 同 ， 程 序 运 
行 也 存在 差异 。 


鉴于 这 些 原因 , 经 过 一 番 纷 争 , 终于 在 1989 年, ANSI(American National 
Standard Institute， 美 国 国家 标准 学 会 ) 通过 了 C 话 言 的 标准 规范 ， 这 就 是 通常 
被 称 为 ANSIC 的 C 语言 。 目 前 使 用 的 C 程序 , 大 部 分 都 是 基于 ANSIC 编写 的 。 


顾名思义 ，ANSI 是 美国 的 标准 。 难 道 不 存在 C 语 言 的 国际 标准 吗 ? 那 是 
不 可 能 的 。ANSI C 后 来 被 ISO 采用 ， 目 前 C 的 真正 标准 应 该 是 ISO 的 C。 男 
外 ， 原 始 的 ANSI 标 准 说 明 书 的 章节 编号 和 ISO 不 同 。 

ISO-C 标准 的 名 称 为 “ISO-IEC 9899-1990”， 当 然 这 是 用 英语 命名 的 。JIS 


(日 本 工业 标准 ) 标准 ( JIS X3010 ) 原样 采用 了 ISO-C 标准 ,所 以 英语 不 太 好 
的 人 (比如 我 )， 也 可 以 获取 日 语 版 的 标准 文档 。” 


从 日 本 工业 标准 协会 可 以 得 到 JIS X3010 标准 ， 以 及 JIS X3010 的 手册 。 
另外 ,《 信 息 处 理 : 编程 语言 篇 》 里 面 也 包含 了 这 个 标准 “， 此 书 可 以 从 书店 订 
购 。 如 果 是 那些 大 型 的 书店 ， 也 许 在 书架 上 就 能 发 现 这 本 书 。 


在 本 书后 面 的 内 容 中 ， 提 到 的 “标准 ”都 是 指 JIS X3010。 

















































































































1.1.5 “C 的 宝典 一 一 K&R 


之 前 已 经 介绍 过 ，Brian Kernighan 和 Dennis Ritchie (C 语言 之 父 ) 合 著 
的 The C Proeramming Laneuage 被 称 为 K&R。 在 制订 ANSI C 之 前 ，K&R 是 
C 语 言语 法 的 使 用 标准 。 

人 们 把 ANSI 之 前 的 C 称 为 “K&R C”, 这 可 能 会 引起 一 些 误 解 。 但 无 论 怎 
样 ， 制 订 了 ANSIC 标 准 之 后 ， 追 随 ANSIC 的 K&R 就 紧 跟 着 出 版 了 第 2 版 外 。 


在 本 书 中 ,提起 ANSIC 之 前 的 C， 我 们 还 是 尊重 事实 ， 称 之 为 “ANSIC 
之 前 的 C”。 






























































@ 国内 读者 可 参考 中 国 国家 标准 GB/T 15272-94， 它 即 为 ISO-IEC 9899-1900 的 中 文 翻译 版 。 
一 一 译 者 注 








x* 2001 年 , JIS 手册 全 面 
修订 , 删除 了 《信息 处 
理 : 编程 语言 篇 》 中 已 
经 存在 的 内 容 。 如 果 在 
所 有 的 标准 中 都 记录 
相同 的 信息 会 引起 不 
必要 的 麻烦 。 


AS - 立 - 
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从 基础 开始 





预备 知识 和 复习 





* 最 初 的 KE&R 第 2 版 ， 
因为 翻译 质量 的 问 
题 ， 恶 评 如 潮 。 重 新 
翻译 后 再 次 出 版 了 修 
订 版 ( 原 书 相同 )。 第 
2 版 上 昌 翻 译 版 的 封面 
为 绿色 ， 新 翻译 版 的 
封面 为 白色 。" 








此 外 ， 本 书 中 提 及 K&R 时 ， 是 指 日 语 版 的 《编程 语言 C》 的 第 2 版 修 
订 版 ”。 
顺便 提 一 下 ， 通 过 























http://www.cs.bell-labs.com/cm/cs/cbook/index.html 


可 以 看 到 K&R 的 网 页 ， 各 语种 的 K&R 封面 排列 在 一 起 ， 颇 为 壮观 。 


EP 
Ty 充 新 的 C 


C 语 言 的 功能 扩展 并 没有 随 着 ANSIC 的 发 布 而 停 下 脚步 .JSO 通过 ISO 
C9X 这 个 代号 名 称 ， 计 划 制 定 具 备 更 多 扩展 功能 的 C 语 言 规范 。 

从 ISO C9X 这 个 代号 名 称 可 以 看 出 来 ， 大 家 都 很 期 待 在 20 世纪 90 年 
代 完 成 新 标准 的 制订 ， 标 准 文档 封面 上 的 日 期 是 1999 年 12 月 1 日 一 一 好 
险 呀 1! 

作为 ISO C99 的 扩展 功能 ， 除 了 提供 对 复数 类 型 的 支持 之 外 ， 还 包括 
“可 以 用 变量 定义 本 地 数组 变量 的 元 素 个 数 ”、“ 将 数组 作为 结构 体 的 成 员 
进行 声明 时 元 素 个 数 可 以 不 定义 ( 只 需 写 [] 等 功能 。 这 些 功能 看 上 去 都 
和 本 书 的 主题 有 重合 的 部 分 。 

尽管 如 此 ， 这 个 “新 的 C” 在 今后 究竟 能 使 用 多 久 ， 我 们 现在 不 得 而 
知 。 所 以 ， 本 书 不 参照 ISO C99。 


1.1.6 C 的 理念 
ANSIC 标准 ， 附 有 Rationale ( 理论 依据 )。 


可 以 通过 下 面 的 地 址 在 线 获取 Rationale。 





ftp://ftp.uu.net/doc/standards/ansi/x3.159-1989/ 


Rationale 中 有 “keep the spirit of C”( 保持 C 的 精神 ) 一 节 ， 关于“C 的 精 


k 
































神 ” 是 这 样 介 绍 的 : 





@ 请 信任 程序 员 (Trust the programmer) 
@ 不 要 阻止 程序 员 去 做 需要 做 的 工作 (Don’t prevent the programmer 








人 中 文 版 请 参考 《C 程序 设计 语言 (第 2 版 新 版 六 一 一 译 者 注 
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from doing what needs to be done) 
@ 保持 语言 的 小 巧 和 简单 〈Keep the language small and simple) 
@ 为 每 一 种 操作 只 提供 一 种 方法 (Provide only way to do an operation ) 
@ 就 算 不 能 保证 可 移植 性 ， 也 要 追求 运行 效率 (Make it fast, even if it is 
not guaranteed to be portable) 


前 面 两 点 最 重要 一 一 这 样 不 负责 任 的 话 它 还 真 敢 说 ! 


C 是 危险 的 语言 ,其 中 随处 可 见 那些 可 以 让 丹 的 上 司 的 上 司 在 不 留心 的 时 
候 ， 屁 股 上 扎 两 个 洞 的 陷阱 。 


尤其 是 ， 在 几乎 所 有 的 C 语言 实现 中 ， 运 行 时 的 检查 总 是 不 充分 的 。 比 
如 ， 数 组 越界 写 入 的 时 候 ， 有 些 语言 是 可 以 当场 给 出 错误 提示 的 ( 如 Java )， 
但 是 在 C 的 大 部 分 处 理 中 ， 总 是 悄悄 地 将 数据 写 入 ， 从 而 破坏 了 完全 不 相关 
的 内 存 区 域 。 


C 是 抱 着 “程序 员 万 能 ”的 理念 设计 出 来 的 。 在 C 的 设计 中 ， 优 先 考虑 
的 是 : 


口 如 何 才 能 简单 地 实现 编译 带 ( 而 不 是 让 使 用 C 的 人 们 能 够 简单 地 编程 ) 
口 如 何 才能 让 程序 员 写 出 能 够 生成 高 效率 执行 代码 的 程序 ( 而 不 是 考虑 
优化 编译 器 ， 使 编译 器 生成 高 效率 的 执行 代码 ) 


而 安全 性 问题 被 完全 忽略 了 。 但 无 论 怎样 ，C 语言 原本 就 是 “仅仅 为 了 自己 使 
用 ”而 开发 出 来 的 语言 。 


幸运 的 是 ， 如 今 的 操作 系统 可 以 替 我 们 停止 那些 已 经 明显 出 现 奇怪 动作 
的 应 用 程序 。 在 UNIX 环境 下 ， 可 以 提示 “Segmentation fault”、“Bus Error” 
等 信息 。Windows 也 可 以 向 我 们 提示 “当前 应 用 程序 正在 进行 异常 操作 ， 所 
以 需要 强制 关闭 ”这 样 的 信息 。 

同样 ， 这 个 时 候 也 不 能 抱 有 “什么 呀 ， 这 个 混蛋 !” 的 想法 ， 而 是 应 该 奉 
上 一 声 感 谢 :“ 谢 谢 ， 操 作 系统 先生 !” 然 后 埋头 开始 调试 工作 。 

虽说 操作 系统 可 以 在 应 用 程序 发 生 明 显 错误 的 时 刻 为 我 们 关闭 应 用 ， 但 
是 在 超出 数值 型 的 字 节 长 度 或 数组 的 边界 写 入 数据 的 时 候 ， 追 踪 bug 还 是 
困难 的 ， 因 为 这 些 错 误 症 状 很 少 能 马上 显现 。 

本 书 第 2 章 将 说 明 C 是 怎样 使 用 内 存 的 。 理 解 了 这 一 点 ， 对 消灭 这 些 不 
易 发 现 的 bug 大 有 神 益 。 
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从 基础 开始 预备 知识 和 复习 





# 根据 JIS X3008 6.6.4.1 
的 备注 内 容 ,“ 标 准 规 
范 或 标准 函数 不 一 定 
遵从 标准 和 函数 的 一 
般 规则 ”。 


党 


党 





偶尔 也 有 可 以 帮 有 我 们 
检查 printf() 的 参数 
个 数 的 编译 器 …… 


当初 基于 PDP-11 的 应 
用 程序 ， 处 理 32 位 的 
乘除 运算 , 以 及 函数 入 
口 和 出 口 的 运行 时 是 


被 


“悄悄 地 ”嵌入 的 。 


要 点 

很 幸运 ， 操 作 系统 可 以 帮助 我 们 停止 应 用 程序 。 

糟糕 的 是 ， 如 果 操 作 系统 不 能 替 我 们 终止 执行 应 用 程序 ， 就 会 上 演 内 存 区 
域 被 破坏 的 悲剧 。 


1.1.7 C 的 主体 
我 在 这 里 想 考 考 你 。 
下 面 的 单词 中 ， 哪 些 是 C 语言 中 规定 的 保留 字 。 
if printf main malloc sizeof 
答案 是 if 和 sizeof。 


“printf 和 malloc 不 必 多 说 , 连 main 也 不 是 C 的 保留 字 吗 ? ”有 这 样 
想法 的 读者 ， 请 查 一 查 手头 的 C 语言 参考 书 。 相 信 大 部 分 的 C 人 门 书籍 中 都 
有 C 语 言 保 留 字 的 列表 。 


C 以 前 的 很 多 语言 ,把 输入 输出 作为 语言 自身 功能 的 一 部 分 ,比如 在 Pascal 
中 与 C 的 printf() 的 功能 相当 的 ， 是 使 用 writeGO) 这样 的 标准 规范 。 它 在 
Pascal 的 语法 规则 中 受到 了 特别 对 待 ”。 


相对 这 种 方式 ，C 语言 将 printfQ) 这 样 的 输入 输出 功能 从 语言 的 主体 部 
分 分 离 出 来 ， 让 它 单纯 地 成 为 库 函 数 。 对 于 编译 器 来 说 ，printf(0) 函数 和 其 
他 由 普通 程序 员 写 的 函数 并 没有 什么 不 同 。 


从 程序 员 的 角度 来 看 ，printfQ) 操 作 一 下 子 就 完成 了 。 其 实 为 了 完成 这 
个 操作 ， 需 要 在 幕后 做 诸如 向 操作 系统 进行 各 种 各 样 的 请 求 等 非常 复杂 的 处 
理 。C 语言 并 没有 把 这 种 复杂 的 处 理 放 在 语言 主体 部 分 , 而 将 它们 全 部 规划 在 
函数 库 中 。 


很 多 编译 型 的 语言 会 将 被 称 为 “run-time routine”( 运行 时 例 程 ) 的 机 器 
码 “ 悄 悄 地 ” 骨 入 到 编译 ( 链接 ) 后 的 程序 中 ,输入 输出 这 样 的 功能 就 是 包 
含 在 run-time routine 之 中 的 。C 语言 基本 上 没有 必须 要 “悄悄 地 ” 般 入 运行 时 
的 复杂 功能 "。 由 于 稍微 复杂 一 点 的 功能 被 全 部 规划 到 了 库 中 ， 程 序 员 只 需要 
去 显 式 地 调用 函数 。 


诚然 ， 这 种 方式 有 它 的 缺点 ， 但 是 也 有 它 的 优点 。 正 因为 这 个 优点 ， 才 
可 能 使 C 语 言 的 程序 开发 和 学 习 变 得 容易 一 些 。 
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1.1.8 C 是 只 能 使 用 标量 的 语言 
对 于 标量 (scalar ) 这 个 词 ， 大 家 可 能 有 些 陌生 。 
简单 地 说 ， 标 量 就 是 指 char 、int、doub1e 和 枚 举 型 等 数值 类 型 ， 以 及 
间 针 。 相 对 地 ， 像 数组 、 结 构 体 和 共用 体 这 样 的 将 多 个 标量 进行 组 合 的 类 型 ， 
我 们 称 之 为 聚合 类 型 (aggregate )。 
早期 的 C 能 使 用 标量 。 
经 常 听 到 初学 者 有 以 下 的 提问 : 
if (str == "abc") 

这 样 的 代码 为 什么 不 能 执行 预期 的 动作 呢 ? 确实 已 经 将 “abc” 

放 到 了 str 中 ， 条 件 表达 式 的 值 却 不 为 真 。 这 是 为 什么 ? 

对 于 这 样 的 疑问 ， 通 常 给 出 的 答案 是 “这 个 表达 式 不 是 在 比较 字符 串 的 

它 只 是 在 比较 指针 ”， 其 实 还 可 以 给 出 另外 一 个 答案 : 

字符 串 其 实 就 是 char 类 型 的 数组 ， 也 就 是 说 它 不 是 标量 ， 当 然 

在 C 里 面 不 能 用 == 进 行 比 较 了 。 

C 就 是 这 样 的 语言 , 一 门 “ 不 用 说 对 于 输入 输出 ,就 连 数 组 和 结构 体 也 放 

弃 了 通过 语言 自身 进行 整合 利用 ”的 语言 。 

但 是 ， 如 今 的 C (ANSIC ) 通过 以 下 几 个 追加 的 功能 ， 

整合 地 使 用 聚合 类 型 了 。 


口 结构 体 的 一 次 性 赋值 
口 将 结构 体 作为 函数 参数 值 传递 
口 将 结构 体 作为 函数 返回 值 返 回 


口 auto 变量 的 初始 化 


当然 ， 这 些 都 是 非常 方便 的 功能 
应 该 去 使 用 )。 可 是 在 早期 的 C 语 言 








1 五 二 
二 诗 一 度 只 




















内 容 ， 



































已 经 能 够 让 我 们 
































， 如 今 已 经 可 以 积极 地 使 用 了 不 如 说 
是 言 里 ,它们 是 不 存在 的 。 为 了 理解 C 语 言 的 
基本 原则 ， 了 解 早 期 的 C 语 言 也 不 是 什么 坏事 。 
特别 要 提出 来 的 是 ， 即 使 是 ANSI C， 也 还 不 能 做 到 对 数组 的 整合 利用 。 
将 数组 赋值 给 男 外 一 个 数组 ， 或 者 将 数组 作为 参数 传递 给 其 他 函数 等 手段 ， 
在 C 语 言 中 是 不 存在 的 。 
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从 基础 开始 





预备 知识 和 复习 





* 既然 是 标准 , 那 总 要 有 
点 标准 的 范 儿 吧 。 





























但 是 ， 因 为 结构 体 是 可 以 被 整合 利用 的 ， 所 以 在 实际 的 编程 中 ， 应 该 积 
极地 使 用 其 可 用 的 功能 。 直 到 现在 ， 还 经 常 能 看 到 使 用 memcpy 来 进行 结构 
体 一 次 性 赋值 的 例子 ， 真 是 做 无 用 功 。 如 果 想 要 复制 结构 体 ， 还 是 让 我 们 使 
用 结构 体 一 次 性 赋值 这 个 功能 吧 。 


1.2 ”关于 指针 


1.2.1 恶名 昭著 的 指针 究竟 是 什么 


关于 “指针 ”一 词 , 在 K&R 中 有 下 面 这 样 的 说 明 (第 5 章 “ 指 针 和 数组 ” 
的 开头 部 分 ): 














旨 针 是 一 种 保存 变量 地 址 的 变量 ， 在 C 中 频繁 地 使 用 。 


其 实在 表达 上 ， 这 样 的 说 明 是 有 很 大 问题 的 。 总 会 让 人 感觉 , 一旦 提起 
指针 ， 就 要 把 它 当 作 变 量 的 意思 。 实 际 上 并 非 总 是 如 此 。 


此 外 , 在 C 语 言 标准 中 最 初出 现 “ 指 针 ” 一 词 的 部 分 ， 有 这 样 一 段 话 : 





























指针 类 型 (pointer type ) 可 由 函数 类 型 、 对 象 类 型 或 不 完全 的 类 
型 派生 ， 派 生 指针 类 型 的 类 型 称 为 引用 类 型 。 指 针 类 型 描述 一 个 对 
象 ， 该 类 对 象 的 值 提供 对 该 引用 类 型 实体 的 引用 。 由 引用 类 型 T 派 
生 的 指针 类 型 有 时 称 为 “( 指向 )T 的 指针 ”。 从 引用 类 型 构造 指针 类 
型 的 过 程 称 为 “指针 类 型 的 派生 ”。 这 些 构造 派生 类 型 的 方法 可 以 递 
归 地 应 用 。 


这 段 话 的 内 容 也 许 会 让 你 一 头 雾 水 。 那 就 让 我 们 先 关注 第 一 句 话 吧 ， 那 
里 出 现 了 “指针 类 型 ”一 词 。 

















提 到 “类 型 *， 立 刻 会 让 人 想起 “int 类 型 “ “double 类 型 ”等 。 同 样 ， 
在 C 语 言 中 也 存在 “指针 类 型 ”这 样 的 类 型 。 
“指针 类 型 ”其 实 不 是 单独 存在 的 ， 它 是 由 其 他 类 型 派生 而 成 的 。 以 上 对 


标准 内 容 的 引用 中 也 提 到 “由 引用 类 型 派生 的 指针 类 型 有 时 称 为 “( 指向 ) 
T 的 指针 ””。 


也 就 是 说 , 实际 上 存在 的 类 型 是 “指向 int 的 指针 类 型 "、“ 指 向 double 
的 指针 类 型 ”。 
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因为 “指针 类 型 ”是 类 型 ， 所 以 它 和 int 类 型 、double 类 型 一 样 ， 也 存 
在 “指针 类 型 变量 ”和 “指针 类 型 的 值 ” 。 粳 糕 的 是 ,“ 指 针 类 型 “指针 类 
型 变量 ”和 “指针 类 型 的 值 ”经 常 被 简单 地 统称 为 “指针 ”， 所 以 非常 容易 造 
成 歧义 ， 这 一 点 需要 提高 警惕 。 


要 点 

先 有 “指针 类 型 ”。 

因为 有 了 “指针 类 型 ”， 所 以 有 了 “指针 类 型 的 变量 ”和 “指针 类 型 的 值 ”。 

比如 , 在 C 中 , 使 用 int 类 型 表示 整数 。 因 为 int 是 “类 型 ”， 所 以 存在 
用 于 保存 int 型 的 变量 ， 当 然 也 存在 int 型 的 值 。 

指针 类 型 同样 如 此 ， 既 存在 指针 类 型 的 变量 ， 也 存在 指针 类 型 的 值 。 


因此 ， 几 乎 所 有 的 处 理 程序 中 ， 所 谓 的 “指针 类 型 的 值 ”， 实 际 是 指 内 存 
的 地 址 。 

变量 的 内 容 是 保存 在 内 存 的 某 个 地 方 的 ,“ 某 个 地 方 ”的 说 法 总 是 会 让 人 
产生 困惑 ， 因 此 ， 就 像 使 用 “门牌 号 ”确定 “住址 ”一 样 ， 在 内 存 中 ,我 们 
也 给 变量 分 配 “ 门 牌号 "。 在 C 的 内 存世 界 里 ,“ 门 牌号 ”被 称 为 “地 址 ”。 


为 了 帮助 理解 这 一 点 ， 还 是 写 一 个 程序 来 验证 一 下 。 










































































1.2.2 ”和 指针 的 第 一 次 杀 密 接触 
下 面 我 们 通过 实际 编程 来 尝试 输出 指针 的 值 (参照 代码 清单 1-1 )。 


代码 清单 1-1 pointer.c 








1: #include <stdio.h> 

2: 

3: int main(void) 

4: 工 

5 int hoge = 5; 

6: int piyo = 10; 

7: int *hoge_p; 

8: 

9: /* 输 出 每 个 变量 的 地 址 */ 
10: printf("&hoge..%p\n", &hoge); 
11: printf("&piyo..%p\n", &piyo); 
12: printf("&hoge_p..%p\n", &hoge_p); 
13: 
14: /* 将 hoge 的 地 址 赋予 hoge_p*/ 
15: hoge_p = &hoge; 





至 少 本 书 还 是 尽力 将 
这 些 说 法 进行 区 别 的 ， 
但 有 时 候 ,无 论 怎么 写 
也 做 不 到 自然 地 表述 
想 要 表达 的 意思 ,最 后 
只 好 投降 …… 非 常 抱 
歉 。 
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16 : 
17: 
18 : 
19 : 
20 : 
21: 
22 : 
23 : 
24: 
25:: 
26 : 


} 


printf("hoge_p..%p\n", hoge_p); 


/* 通 过 hoge_p 输出 hoge 的 内 容 */ 
printf("*hoge_p..%d\n", *hoge_p); 


/* 通 过 hoge_p 修改 hoge 的 内 容 */ 
*hoge_p = 10; 
printf("hoge..%d\n", hoge); 


return 0; 








下 面 是 我 的 环境 (FreeBSD 3.2-RELEASE 和 gcc version 2.7.2.1) 里 输出 的 














天 
结果 。 








&hoge. .0xbfbfd9e4 
&piyo. .0xbfbfd9e0 
&hoge_p. .0xbfbfd9dc 


hoge_p. .0xbfbfd9e4 
*yhoge_p..5 


hoge. .10 




















第 5~7 行 声明 了 int 类 型 变量 hoge、piyo 和 “指向 int 的 指针 ”类 型 
的 变量 hoge_p。 如 果 理 解 hoge_p 的 声明 有 困难 ， 不 妨 先 单纯 地 将 它 理 解 成 
“指向 int 的 指针 ”类 型 的 变量 ( 请 参照 本 节 的 补充 内 容 )。 

int 类 型 的 变量 hoge 和 piyo， 在 声明 的 同时 分 别 被 初始 化 为 5 和 10。 


在 第 10~12 行 ， 使 用 地 址 运算 符 &， 输 出 各 变量 的 地 址 。 在 我 的 环境 中 ， 
变量 在 内 存 中 保存 成 下 面 这 样 (请 参照 图 1-1 )。 



































Oxbfbfd9dc 
hoge_p 
森 赋 全 








Oxbfbfd9e0 5 
piyo 
10 
Oxbfbfd9e4 
hoge 
5 
Oxbfbfd9e8 . 


图 1-1 变量 的 保存 状况 
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总 觉得 在 我 的 环境 中 ， 变 量 是 按照 声明 的 逆向 顺序 保存 在 内 存 中 的 。 可 
能 会 让 人 感觉 有 些 奇妙 ， 其 实 这 是 常见 的 现象 ， 不 要 太 在 意 。 





量 不 一 定 按照 声明 的 顺序 保存 在 内 存 中 。 


前 面 曾 经 提 到 ， 因 为 存在 “指针 类 型 ”， 所 以 存在 “指针 类 型 的 变量 ”和 
“指针 类 型 的 值 ”。 这 里 输出 的 “地 址 ”， 是 指 “ 指 针 类 型 的 值 ”。 


另外 ,以 上 的 例子 在 使 用 printfQ) 输 出 指针 的 值 时 ,使 用 了 参数 %p。 很 
多 人 都 使 用 过 %x 这 样 的 参数 。 遗 憾 的 是 ， 这 种 使 用 方式 是 错误 的 。 关 于 这 点 
的 解释 ， 请 参照 1.2.3 节 。 


在 第 15 行 ,将 hoge 的 地 址 赋 给 指针 变量 hoge_p。 因 为 hoge 的 地 址 是 
0xbfbfd94e4， 这 时 内 存 变 成 图 1-2 所 示 的 状态 。 


像 这 样 ， 指 针 变 量 hoge_p 保存 了 另外 一 个 变量 hoge 的 地 址 ， 我 们 认为 
“hoge_p 指向 hoge”。 


此 外 ， 对 hoge 变量 实施 & 运 算得 到 “hoge 的 地 址 ”。 有 时 候 也 称 “hoge 
的 地 址 ”的 值 为 “指向 hoge 的 指针 ”( 此 时 的 “指针 ” 指 的 是 “指针 类 型 的 
值 ” 入 

在 我 的 环境 里 ， 变 量 是 按照 声明 的 逆向 顺序 保存 在 内 存 中 的 。 根 据 不 同 


的 环境 ， 内 存 中 变量 位 置 的 顺序 可 能 有 所 不 同 ， 纠 结 于 究竟 hoge 、piyo 和 
hoge_p 以 什么 样 的 顺序 排列 是 没有 意义 的 。 图 1-2 也 可 以 用 图 1-3 的 表现 方式 。 






































0xbfbfd9dc 
hoge_p 





Oxbfbfd9e4 


Oxbfbfd9e0 a 
piyo 
hoge_p 保 存 了 


10 hoge 的 地 址 


hoge 
5 


图 1-2 将 指向 hoge 的 指针 的 值 赋 给 hoge_p 


0xbfbfd9e4 





Oxbfbfd9e8 











20 第 1 章 从 基础 开始 一 一 预备 知识 和 复习 
5 
piyo 
10 


图 1-3 图 1-2 的 另 一 种 表现 方式 





上 图 更 能 直接 地 表现 “hoge_p 指向 hoge” 这 个 含义 。 








在 第 19 行 ， 使 用 解 引用 * ,“ 顺 茧 摸 瓜 ”输出 hoge 的 值 。 


在 指针 前 面 加 上 *， 可 以 表示 指针 指向 的 变量 。 因 为 hoge_p 指向 hoge， 
所 以 *hoge_p 等 同 于 hoge。 一 旦 要 求 输出 *hoge_p, 就 会 输出 hoge 中 保存 的 
值 5。 


因为 *hoge_p 和 hoge 表示 同一 个 事物 ， 通 过 *hoge_p 输出 hoge 的 值 之 
外 ,还 可 以 赋值 。 在 第 22 行 ,通过 将 10 赋 给 *hoge_p， 修 改 了 hoge 的 值 。 在 
第 23 行 输出 hoge 的 值 ， 运 行 结果 为 10。 








指针 的 基本 知识 就 介绍 到 这 里 。 以 下 是 整理 出 的 要 点 。 


要 点 
口 对 变量 使 用 & 运 算 符 , 可 以 取得 该 变量 的 地 址 。 这 个 地 址 称 为 指向 该 变量 
的 指针 。 


口 指针 变量 hoge_p 保存 了 指向 其 他 变量 的 地 址 的 情况 下 ,可 以 说 “hoge_p 
指向 hoge”。 

口 对 指针 变量 运用 * 运 算 符 ， 就 等 同 于 它 指 向 的 变量 。 如 果 hoge_p 指向 
hoge，*hoge_p 就 等 同 于 hoge。 


补 
名 充 关于 十 六 进 抽 


在 说 明 地 址 概念 的 时 候 ， 世 上 的 C 语言 入 门 书 籍 中 经 常 使 用 “门牌 号 
100” 这 样 极其 小 的 十 进 制 值 。 

确实 ， 对 于 初学 者 来 说 ， 可 能 这 样 更 容易 入 门 。 但 是 本 书 偏执 地 使 用 
了 十 六 进 制 来 说 明 。 这 是 因为 ， 如 果 想 要 了 解 地 址 的 真正 面目 ， 把 地 址 实 
际 地 表示 出 来 才 是 最 好 的 方式 。 本 书 例 程 中 输出 的 所 有 地 址 ， 全 部 是 通过 
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我 的 环境 实际 运行 程序 后 获得 的 。 

对 于 那些 对 指针 还 是 不 大 明白 的 读者 来 说 ， 一 定 也 要 像 我 这 样 将 例 程 
实际 地 敲 一 遍 ， 然 后 通过 自己 的 环境 确认 一 下 究竟 会 输出 什么 东 东 。 当 然 ， 
通过 你 自己 的 环境 输出 的 地 址 肯定 和 我 的 环境 中 输出 的 不 同 ， 但 是 其 中 的 
原理 是 一 样 。 

哦 ? 你 说 你 不 懂 十 六 进 制 ? 
面 的 知识 。 





不 好 意思 ， 你 应 该 事先 学 习 一 下 这 方 


补 

馈 充 混乱 的 声明 一 一 如 何 自然 地 理解 声明 ? 
通常 ，C 的 声明 像 
int hoge; 


这 样 ， 使 用 “类 型 变量 名 ;” 的 形式 进行 书写 。 
可 是 , 像 “指向 int 的 指针 ”类 型 的 变量 ， 却 要 像 下 面 这 样 进行 声明 


int *hoge_p; 
似乎 这 里 声明 了 一 个 名 为 *hoge_p 的 变量 ， 而 实际 上 ， 这 里 声明 的 变 
量 是 hoge_p，hoge_p 的 类 型 是 “指向 int 的 指针 ”。 


因为 这 种 声明 方式 不 太 好 理解 ， 所 以 有 人 提出 将 * 靠 近 类 型 这 一 侧 进 
书写 ， 如 下 : 


int* hoge_p; 


的 确 ， 这 种 书写 方式 符合 “类 型 变量 名 ;” 的 形式 。 但 是 在 同时 声明 多 
变量 的 情况 下 就 会 出 现 破 绽 : 


/* 声 明 两 个 “指向 int 的 指针 ”? 一 一 其 实 不 是 */ 
int* hoge_p, piyo_p; 


此 外 ， 数 组 也 是 C 的 一 种 类 型 ， 比 如 
int hoge[10]; 


这 样 的 写法 ， 就 不 符合 “类 型 变量 名 ;” 的 形式 。 
说 一 些 题 外 话 ，Java 在 声明 “int 的 数组 ”时 ， 通 常 写 成 


int[] hoge; 


党 


篇 ] - 立 
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Java 可 以 通过 在 使 用 
new 进行 实例 化 的 时 
候 定义 数组 元 素 的 个 
数 , 所 以 这 里 没有 元 素 
个 数 的 声明 。 


的 形式 ,这样 好 像 是 符合 “类 型 变量 名 ;” 的 形式 。 至 少 在 这 一 点 上 ，Java 
的 语法 比 起 C 显得 更 为 合理 。 可 是 ，Java 为 了 让 C 程序 员 更 容易 地 将 程序 
向 Java 移植 ， 况 然 也 兼容 int hoge[] 这 样 的 写法 。 这 种 不 伦 不 类 的 做 法 
倒 还 真 像 Java 的 风格 。 

我 们 换个 角度 考虑 问题 ， 对 于 


int *hoge_p; 


这 个 声 明 ， 因为 当 hoge_p 指向 hoge 的 时 候 ， *hoge_p 和 hoge 可 以 同等 
地 使 用 ， 所 以 有 人 可 能 会 产生 下 面 的 想法 。 


你 们 看 ， 一 旦 在 hoge_p 之 前 追加 *， 就 可 以 和 int 变量 hoge 
同样 使 用 呢 。 也 就 是 说 ， 这 个 声明 意味 着 hoge_p 之 前 追加 上 * 后 
成 为 int 类 型 了 。 
这 种 思考 方式 , 确实 也 有 它 一 定 的 道理 ( 比如 数组 也 同样 可 以 这 么 说 )， 
那么 ， 如 果 写 成 





int *&hoge; 

这 样 ，hoge 是 可 以 作为 int 类 型 的 变量 来 声明 的 吧 ? 尝试 一 下 就 会 明白， 
这 里 会 发 生 一 个 语法 错误 。 

其 次 ， 在 声明 中 出 现 const 的 时 候 ， 这 种 观点 也 会 出 现 破 绽 (表达 式 
中 是 不 可 以 出 现 const 的 )， 声 明 指 向 函数 的 指针 时 同样 会 出 现 问题 。 

以 我 的 经 验 来 看 ， 一 切 关 于 “如 果 这 样 考 虑 ， 是 不 是 就 可 以 很 自然 地 
解释 C 的 声明 了 ? ”的 尝试 都 是 徒劳 的 。 为 什么 这 么 说 ， 因 为 C 语 言 的 语 
法 本 来 就 是 不 自然 、 奇 怪 而 又 变态 的 。 

在 第 3 章 会 详细 地 说 明 C 的 声明 语法 。 姑 且 带 着 问题 继续 往 下 阅读 吧 。 


的 
“Ty 碗 关于 int main(void) 


在 C 语 言 标准 中 ， 关 于 main() 函数 的 使 用 只 有 如 下 两 种 方式 : 
int main(int argc, char *argv[]) 

或 者 
int main(void) 


尽管 如 此 ， 还 是 可 以 在 一 些 入 门 书籍 中 遇 到 
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void main(void) 
这 样 的 写法 ， 这 是 错误 的 。 确 实 ， 就 算是 这 么 写 ， 很 多 程序 也 能 动 起 来 。 
但 是 在 有 些 环境 下 ， 编 译 器 可 能 会 报告 一 些 警 告 信息 。 
main 函数 返回 一 个 int 类 型 的 值 ， 因 此 在 处 理 的 最 后 必须 有 return 
(现在 的 很 多 编译 器 都 会 提示 没有 return 的 警告 )。 
本 书 所 有 例 程 的 main 函数 的 末尾 都 写 了 return 0;。 
返回 0 表示 通知 运行 环境 程序 “正常 结束 ”。 
题 
好 外 
“Ty 话 hoge 是 什么 ? 
本 书 的 例 程 中 ， 经 常 使 用 hoge 或 piyo 作为 变量 的 名 称 。 
这 是 哈 ? 很 多 人 会 有 这 样 的 疑问 。 在 日 本 ，hoge 这 个 名 字 使 用 非常 广 
泛 。 在 为 变量 和 文件 的 取 名 感到 苦恼 的 时 候 ， 大 家 经 常 使 用 hoge 这 个 词 。 
通常 都 会 给 变量 取 一 个 有 意义 的 名 字 ， 但 因为 本 书 是 单纯 讲解 C 语法 
的 书 , 所 以 很 多 地 方 使 用 了 没有 实际 意义 的 单词 。 当然 了 , 就 算 使 用 了 “a”、 
“b” 这 样 的 变量 名 称 ， 编 译 器 也 不 会 抱怨 什么 ， 但 是 这 种 一 个 字母 的 变量 
名 用 在 面向 初学 者 的 书 中 ， 似 乎 不 太 合适 。 
为 了 也 能 明确 地 表示 那些 没有 意义 的 变量 ,我 们 使 用 具有 4 个 字母 的 hoge。 
谁 也 不 知道 是 哪个 大 侠 最 先 使 用 hoge 这 个 单词 的 。 目 前 最 有 力 的 说 法 
是 ， 在 20 世 纪 80 年 代 前 半期 hoge 在 日 本 各 地 被 同时 频繁 地 使 用 起 来 ， 
详细 的 说 明 请 参见 : 
“关于 hoge 的 网 页 ” 
http://kmaebashi.com/programmer/hoge.html” * 原始 网 页 已 经 取消 不 
在 美国 ， 和 hoge 这 个 单词 一 样 ，foo 和 bar 等 单词 经 常 被 使 用 。 偶尔 能 访问 了 。 承 蒙 作者 吉 
可 以 在 OS 的 操作 手册 等 资料 中 看 见 它们 的 身影 。 a 
的 内 容 已 转载 入 我 的 


网 页 中 。 


1.2.3 ”指针 和 地 址 之 间 的 微妙 关系 
在 本 章 1.2.1 节 中 ， 有 下 面 一 句 话 : 


几乎 所 有 的 处 理 程序 中 ， 所 谓 的 “指针 类 型 的 值 ” ， 实 际 是 指 内 
存 的 地 址 。 


对 于 这 名 话 ， 有 人 也 许 会 产生 下 面 的 疑问 。 
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【常见 疑问 之 1】 
归根 结 底 ， 指 针 就 是 地 址 ,地 址 就 是 内 存 中 被 分 配 的 “门牌 号 ”。 
所 以 ， 指 针 类 型 和 int 类 型 应 该 是 一 回 事 吧 。 


实际 上 ， 从 茶 种 意义 来 看 ， 这 种 认识 也 不 无 道理 。 


在 C 语言 前 身 的 B 语言 中 ， 指 针 和 整数 是 没有 区 别 的 。 此 外 ， 虽 然 我 们 
经 常 使 用 printf() 和 %p 来 表示 指针 , 实际 上 包括 我 的 运行 环境 在 内 , 使 用 %x 
也 可 以 很 好 地 表示 地 址 。 对 不 太 擅 长 十 六 进 制 的 人 来 说 ， 通 过 使 用 xd， 也 能 
利用 十 进 制 的 方式 来 确认 地 址 的 内 容 。 

很 可 惜 ， 这 里 说 的 运行 环境 并 不 具有 普 适 性 。 其 实在 很 多 的 运行 环境 中 ， 
int 类 型 和 指针 类 型 的 长 度 并 不 相同 ， 此 外 ， 由 于 Intel 8086 的 功能 限制 ， 在 
直到 最 近 还 被 广泛 使 用 的 MS-DOS 中 ,是 通过 将 16 位 的 值 分 成 两 组 来 表示 20 
位 的 地 址 的 "。 


还 有 















































不 ， 还 是 先 回答 下 一 个 问题 吧 。 


【常见 疑问 之 2】 
指针 就 是 地 址 吧 。 那 么 ， 指 向 int 的 指针 也 好 ， 指 向 double 
的 指针 也 好 ， 它 们 有 什么 不 一 样 吗 ? 有 必要 去 区 分 它们 吗 ? 


在 某 种 意义 上 ， 这 种 说 法 也 有 一 定 道理 。 


对 于 大 部 分 的 运行 环境 来 说 ， 当 程序 运行 时 ， 不 管 是 指向 int 的 指针 ， 
还 是 指向 double 的 指针 , 都 保持 相同 的 表现 形式 ( 偶尔 也 会 有 一 些 运行 环境 ， 
它们 对 于 指向 char 的 指针 和 指向 int 的 指针 有 着 不 一 样 内 部 表示 和 位 数 )。 


不 仅 如 此 ，ANSIC 还 为 我 们 准备 了 “可 以 指向 任何 类 型 的 指针 类 型 ”一 一 


void* 类 型 。 


























1 int hoge = 5; 
2: void hoge_p; 
3 
4 


hoge_p = &hoge; 这 里 不 报错 
5 printf("%d\n"， hoge_p); / 打印 输出 hoge_p 指向 的 变量 的 值 / 
以 上 代码 中 的 第 4 行 是 不 会 报错 的 。 























Q@ 8086 是 分 段 寻 址 的 ， 具 体 来 说 是 指 一 个 物理 地 址 由 段 地 址 ( segment selector ) 与 偏 移 量 
( offset ) 两 部 分 组 成 ， 长 度 各 是 16 位 。 其 中 段 地 址 左 移 4 位 〈 即 乘 以 16 ) 与 偏 移 量 相 加 
即 为 物理 地 址 。 一 一 译 者 注 
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但 是 , 像 第 5 行 这 样 在 hoge_p 前 附加 * 
和 
口 : 


蔗 


在 我 的 环境 里 会 出 现下 面 的 


warning: dereferencing "void *' pointer 
invalid use of void expression 























只 需 稍微 考虑 一 下 ， 就 知道 出 现 这 样 的 错误 是 意料 之 中 的 。 如 果 仅 仅 告 
之 内 存 地 址 ， 却 没有 告 之 在 那个 地 址 上 保存 的 数据 类 型 ， 当 然 是 不 能 取出 值 
来 的 。 
































如 果 将 上 面 的 第 5 行 修改 成 下 面 这 样 ， 不 但 可 以 顺利 地 通过 编译 ， 甚 至 
可 以 正常 地 运行 。 























5 : printf(C"%d\n"，*(intx*)hoge_p); /* 将 hoge_p 强制 转换 成 int* */ 
这 里 通过 将 “所 指 类 型 不 明 的 指针 ”hoge_p 强制 转型 成 “指向 int 的 指 
针 ”， 来 告 之 编译 器 类 型 信息 ， 由 此 可 以 取出 int 类 型 的 值 。 








但 每 次 都 这 村 




















写 是 比较 繁琐 的 ， 不 妨 事先 写成 以 下 的 声明 : 
int *hoge_p; 
因为 编译 器 可 以 记 住 “hoge_p 是 指向 int 的 指针 ”， 所 以 只 需要 简单 地 在 
hoge_p 前 面 添加 * ， 就 可 以 通过 指针 间接 取 值 。 


























之 前 也 提 到 ， 在 大 部 分 的 运行 环境 里 ,不管 是 “指向 int 的 指针 ”， 还 是 
“指向 double 的 指针 ”, 在 运行 时 都 是 相同 的 事物 。 可 是 , 通过 在 int 类 型 的 
变量 之 前 加 上 & 来 取得 它 的 指针 ， 随 后 利用 指针 间接 取出 来 的 值 ， 不 出 意外 肯 
定 是 int 类 型 。 为 什么 ? 因为 int 和 double 的 内 部 表示 完全 不 同 。 


因此 ， 如 今 的 运行 环境 ， 像 下 面 这 样 取得 指向 double 
之 后 将 其 赋 给 指向 int 的 指针 变量 











E 避 

















类 型 变量 的 指针 ， 
， 编 译 需 必定 会 提示 警告 。 

















int *int_p; 
double double_variable; 


/* 将 指向 double 变量 的 指针 赋予 指向 1nt 的 指针 变量 (恶搞 | ) */ 
int_p = &double_variable; 


顺便 说 一 下 ， 在 我 的 环境 里 出 现 了 下 面 的 警告 : 


warning: assignment from incompatible pointer type 














下 面 的 “指针 运算 ”这 一 小 节 ， 会 进一步 说 明 “ 编 译 强 会 帮 我 们 记 住 指 
针 指向 什么 样 的 类 型 ”的 重要 意义 。 
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1.2.4 ”指针 运算 
C 语 言 的 指针 运算 功能 是 其 他 语言 所 没有 的 。 





























指针 运算 是 针对 指针 进行 整数 加 减 运 算 ， 以 及 指针 之 间 进 行 减法 运算 的 
功能 。 
我 们 先 来 看 一 看 下 面 这 个 例 程 〈 参 照 代 码 清单 1-2 )。 
【注意 1】 


严格 地 说 ， 代 码 清单 1-2 的 程序 并 不 符合 C 语言 标准 。 

对 于 指针 加 减 运算 ， 标 准 只 允许 指针 指向 数组 内 的 元 素 ， 或 者 
超过 数组 长 度 的 下 一 个 元 素 。 指 针 运 算 的 结果 也 只 是 允许 指针 指向 
数组 内 的 元 素 ， 以 及 超过 数组 长 度 的 下 一 个 元 素 (关于 这 一 点 ， 请 
参照 4.3.2 节 的 补充 内 容 “ 指 针 可 以 指向 数组 最 后 元 素 的 下 一 个 元 
素 ”)。 标 准 没有 对 除 此 之 外 的 情况 做 出 任何 定义 。 在 下 面 的 例 程 中 ， 
因为 对 不 是 指向 数组 的 指针 hoge_p 进行 了 加 法 运算 , 所 以 它 在 这 一 


# 标准 写 道 :“ 一 个 指向 点 上 违反 了 C 语 言 标准 ”。 
在 大 多 数 的 环境 下 ， 这 个 程序 是 可 以 运行 本 Re 
指向 只 包含 一 个 元 素 后 面 的 问题 ， 比 起 严格 遵守 标准 ， 我 还 是 选择 了 这 个 简单 、 直 接 的 


， | ) 的 
数组 的 第 一 个 元 素 的 
指针 ， 具 有 相同 的 意 
义 ”。 因此， 只 要 你 不 代码 清单 1-2 pointer calc.c 


做 加 2 以 上 (包括 2) 


例 程 。 











1: #include <stdio.h> 
入 加 法 运算 就 不 会 出 2: 
现 错误 。 3: int main(void) 
4: { 
5 int hoge; 
6: int *hoge_p; 
天 
8: /* 将 指向 hoge 的 指针 赋予 hoge_p */ 
9: hoge_p = &hoge; 
10: /* 输 出 hoge_p 的 值 */ 
11: printf("hoge_p..%p\n", hoge_p); 
12: /* 给 hoge_p 加 1*/ 
13: hoge_p++; 
14: /* 输 出 hoge_p 的 值 */ 
15 : printf("hoge_p..%p\n", hoge_p); 
16: /* 输 出 hoge_p 加 3 后 的 值 */ 
17: printf("hoge_p..%p\n", hoge_p + 3); 
18 : 
19 : return 0; 
20: } 
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我 的 环境 中 的 结果 如 下 : 


hoge_p..0xbfbfd9e4 一 一 最 初 的 值 


hoge_p..0xbfbfd9e8 一 一 加 工 后 的 值 
hoge_p. .0xbfbfd9f4 一 一 加 工 之 后 再 加 3 的 值 








第 9 行 ， 将 指向 hoge 的 指针 赋予 hoge_p， 第 11 行 输出 hoge_p 的 值 。 
我 的 环境 里 ，hoge 被 保存 在 门牌 号 为 0xbfbfd9e4 的 地 址 中 。 


在 第 13 行 ， 使 用 运算 符 ++， 给 hoge_p 加 1。 








输出 结果 ……… 0xbfbfd9e4 变 成 了 0xbfbfd9e8， 为 什么 不 是 增加 了 1， 
而 是 增加 了 4 呢 ? 


在 第 17 行 ， 给 加 1 后 的 hoge_p 再 加 上 3， 输 出 的 结果 由 0xbfbfd9e8 
变 成 了 0xbfbfd9f4， 增 加 了 12。 


这 就 是 指针 运算 的 特征 。 在 C 语言 中 ， 对 指针 进行 加 1 运算 ， 地 址 的 值 
会 增加 当前 指针 所 指向 数据 类 型 的 长 度 。 例 程 中 的 hoge_p 是 “指向 int 的 
昌 针 ”， 因 为 我 的 环境 中 int 类 型 的 长 度 为 4， 所 以 给 地 址 加 1， 指 针 前 进 4 
个 字 节 ， 给 地 址 加 3， 指针 就 前 进 12 个 字 节 。 


要 点 
对 指针 加 N， 指 针 前 进 “ 当 前 指针 指向 的 数据 类 型 的 长 度 xN”。 

















【常见 疑问 之 3】 
间 针 就 是 地 址 吧 ,给 指针 加 1 指针 难道 不 应 该 前 进 ] 个 字 节 吗 ? 
这 是 最 常见 的 疑问 了 。 理 解 这 一 点 的 前 提 ， 需 要 先 弄 清楚 C 语言 中 指针 
和 数组 之 间 有 什么 样 的 微妙 关系 ， 以 及 为 什么 C 中 会 存在 指针 运算 这 样 奇 怪 
的 功能 。 


关于 这 些 问题 ， 稍 后 会 进行 说明 ， 目 前 还 是 让 我 们 带 着 疑问 往 下 走 吧 




















O 


1.2.5 “什么 是 空 指针 
空 指针 是 一 个 特殊 的 指针 值 。 


空 指针 是 指 可 以 确保 没有 指向 任何 一 个 对 象 的 指针 。 通 常 使 用 宏 定义 
NULL 来 表示 空 指 针 常 量 值 。 
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空 指针 确保 它 和 任何 非 空 指 针 进 行 比较 都 不 会 相等 ， 因 此 经 常 作 为 函数 
发 生 异 常 时 的 返回 值 使 用 。 男 外 ， 对 于 第 5 章 的 链表 来 说 ， 也 经 常 在 数据 的 
末尾 放 上 一 个 空 指针 来 提示 :“ 请 注意 ,后面 已 经 没有 元 素 了 哦 。” 








在 如 今 的 操作 系统 下 ， 应 用 程序 一 旦 试图 通过 空 指针 引用 对 象 ， 就 会 马 
* 并 不 是 所 有 的 操作 系 。 上 招致 一 个 异常 并 且 当 前 应 用 程序 会 被 操作 系统 强制 终止 。 因 此 ， 如 果 每 次 
统 都 能 对 空 指针 引用 都 使 用 NULL 来 初始 化 指针 变量 , 在 错误 地 使 用 了 无 效 ( 未 初始 化 ) 的 指针 时 ， 


进行 错误 处 理 的 。 像 ”我 们 就 可 以 马上 发 现 潜在 的 bug。 
DOS 这 样 没有 内 存 保 


护 功能 的 操作 系统 也 通常 ， 我 们 可 以 根据 指针 指向 的 数据 类 型 来 明确 地 区 别 指针 的 类 型 。 如 
就 时 了 ， 连 UNIX 居 ” 果 将 “指向 int 的 指针 ” 赋 给 “指向 double 的 指针 ”， 如 今 的 编译 器 会 报 出 
然 也 允许 通过 空 指针 前面 提 到 的 警告 。 但 是 ， 只 有 NULL， 无 论 对 方 指向 什么 类 型 的 变量 ， 都 可 以 
Wi 被 赋值 和 比较 。 


时 尔 会 见 到 先 将 空 指针 强制 转型 ,然后 进行 赋值 、 比 较 操作 的 程序 ， 这 
不 但 是 徒劳 的 ， 甚 至 还 会 让 程序 变 得 难以 阅读 。 



























































站 


























一 、 

















补 
Ty 充 NULL、0 和 "0' 


经 常 有 一 种 错误 的 程序 写法 : 使 用 NULL 来 结束 字符 串 。 


/* 
* 通 常 ,，C 的 字符 串 使 用 '\0' 结 尾 ， 可 是 因为 strncpy() 函 数 在 src 的 长 度 大 于 1en 
* 的 情况 下 没有 使 用 '\0' 来 结束 ， 所 以 一 板 一 眼 地 写 了 一 个 整理 成 C 的 字符 串 形式 的 
* 瑶 数 ( 企图 ) 
*/ 
void my_strncpy(char *dest, char *src, int len) { 
strncpy(dest, src, len); 
dest[len] = NULL; 一 一 使 用 NULL 来 结束 字符 串 ! ! 
} 


上 面 的 代码 ， 尽 管 在 某 些 运行 环境 下 能 跑 起 来 ， 但 无 论 怎样 它 就 是 错 
误 的 。 因 为 字符 串 是 使 用 “ 空 字符 ”来 结束 的 ， 而 不 是 用 空 指 针 来 结束 。 
在 C 语 言 标准 中 ， 空 字符 的 定义 为 “所 有 的 位 为 0 的 字 节 称 为 空 字符 
(null character )) (5.2.1 )。 也 就 是 说 ， 空 字符 是 值 为 0 的 字符 。 
空 字符 在 表现 上 通常 使 用 '\0'。 因 为 '\0' 是 常量 ， 所 以 实际 上 它 等 同 
于 0。 也 许 有 些 吓 到 你 了 ，'\0' 呀 'a' 呀 什么 的 ， 它 们 的 数据 类 型 其 实 并 不 
* 如 果 是 C++, 就 不 是 这 是 char， 而 是 int 。 
个 结论 了 。 另外 ， 在 我 的 环境 中 ，NULL 在 stdio.h 里 的 定义 如 下 : 
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#define NULL 0 


看 到 这 个 ， 你 可 能 会 说 :“ 说 来 说 去 ， 那 还 不 都 是 0 嘛 。” 确 实在 大 部 
分 的 情况 下 是 这 样 的 ， 但 背后 的 事情 却 异常 复杂 。 

正如 前 面 说 的 那样 , 写成 '\0' 和 写成 常量 的 0 其 实 是 一 样 的 。 使 用 'N0' 
只 不 过 是 习惯 使 然 。 如 果 想 让 代码 容易 读 ， 遵 从 习惯 是 非常 重要 的 。 

将 0 当 作 空 指针 来 使 用 , 除了 极其 例外 的 情况 , 通常 是 不 会 发 生 错误 的 。 

但 是 ， 如 果 在 字符 串 的 最 后 使 用 NULL， 就 必然 会 发 生 错 误 。 

标准 允许 将 NULL 定义 成 (voidx)0， 所 以 在 NULL 被 定义 成 (void*) 的 
时 候 ， 如 果 使 用 NULL 来 结束 字符 串 ， 编 译 器 必然 会 提示 警告 。 

看 到 刚才 的 关于 NULL 的 定义 ， 可 能 有 人 会 产生 下 面 的 推测 : 


啥 呀 ? 所 谓 空 指针 ， 不 就 是 为 0 的 地 址 嘛 。 
在 C 中 , 为 0 的 地 址 上 应 该 是 不 能 保存 有 效 数据 的 吧 ? 放 什 么 
都 起 不 到 任何 作用 ， 这 没什么 大 不 了 的 。 


这 种 推测 好 像 颇 有 道理 ， 但 也 是 有 问题 的 。 

确实 在 大 多 数 的 环境 中 ， 空 指针 就 是 为 0 的 地 址 。 但 是 ， 由 于 硬件 状 
况 等 原因 ， 世 上 也 存在 值 不 为 0 的 空 指针 。 

偶尔 会 有 人 在 获得 一 个 结构 体 之 后 , 先 使 用 memset() 将 它 的 内 存 区 域 
清 零 然后 再 使 用 。 此 外 ， 虽 然 C 语言 提供 了 动态 内 存 分 配 函 数 malloc() 
和 calloc()， 但 是 抱 着 “ 清 零 后 比较 好 ”的 观点 ， 偏 爱 calloc() 的 人 倒 
有 很 多 。 这 样 也 许可 以 避免 一 些 难 以 再 现 的 bug。 

使 用 memset() 和 callocO 〇 将 内 存 区 域 清 替 ， 其 实 就 是 单纯 地 使 用 0 
来 填充 位 。 通 过 这 种 处 理 ， 当 结构 体 的 成 员 中 包含 指针 的 时 候 ， 这 个 指针 
能 不 能 作为 空 指针 来 使 用 ， 最 终 是 由 运行 环境 来 决定 的 。 

顺便 说 一 下 ， 对 于 浮 点 数 ， 即 使 它 的 位 模式 为 0， 值 也 不 一 定 为 0 。 

说 到 这 里 ， 

哦 ， 原 来 这 样 师 ， 所 以 要 使 用 宕 定义 的 NULL 呢 。 对 于 空 指 
针 的 值 不 为 0 的 运行 环境 ，NULL 的 值 应 该 被 #define 成 别 的 值 吧 。 


可 能 会 有 人 产生 以 上 的 想法 。 实 际 上 ， 这 种 想法 也 是 有 偏差 的 ， 这 涉及 问 
题 的 内 部 根源 。 
比如 ， 尝 试 编译 下 面 的 代码 : 


int x*p = 3; 


在 我 的 环境 里 ， 会 出 现 以 下 警告 : 


# 整数 类 型 还 好 ， 但 是 
我 还 是 感觉 依赖 环境 
编 出 来 的 代码 是 不 于 
净 的 。 
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warning: initialization makes pointer from integer without a cast 


因为 3 无 论 怎么 说 都 是 int 型 ， 指 针 和 int 型 是 不 一 样 的 ， 所 以 编译 
会 提示 敬告。 尽管 在 我 的 环境 里 指针 和 int 的 长 度 都 是 4 个 字 节 ， 但 还 
现 了 警告 。 如 今 的 编译 器 ， 几 乎 都 是 这 样 的 。 

a 试 编译 下 面 的 代码 ; 


器 
: 


int *p = 0; 


这 一 次 没有 警 0 

如 果 说 将 int 型 的 值 赋予 指针 就 会 得 到 一 个 敬告， 那么 为 什么 值 为 3 
的 时 候 出 现 警 告 ， 值 为 0 的 时 候 却 没有 警告 呢 ? 简直 匪夷所思 1! 

这 是 因为 在 C 语言 中 ,“ 当 常量 0 处 于 应 该 作为 指针 使 用 的 上 下 文中 
时 ， 它 就 作为 空 指针 使 用 "。 上 面 的 例子 中 ， 因 为 接受 赋值 的 对 象 为 指针 ， 
编译 器 根据 上 下 文 判断 出 “0 应 该 作为 指针 使 用 ， 所 以 将 常数 0 作为 空 指 
针 来 读 取 。 

无 论 如 何 ， 编 译 器 都 会 针对 性 地 对 待 “需要 将 0 作为 指针 进行 处 理 的 
上 正文 ”， 所 以 即便 是 空 指 针 的 值 不 为 0 的 情况 下 ， 使 用 常量 0 来 代替 空 指 
针 也 是 合法 的 。 

此 外 ， 如 上 所 述 ， 有 的 环境 中 像 下 面 这 样 定义 NULL: 


#define NULL ((void*)0) 


ANSIC 中 ,根据 “应 该 将 0 作为 指针 进行 处 理 的 上 下 文 ” 的 原则 ， 将 
常量 0 作为 指针 来 处 理 。 因 此 ， 显 式 将 0 强制 转型 成 void* 是 没有 意义 的 。 
但 是 在 某 些 情况 下 ， 编 译 器 也 可 能 会 理解 不 了 “应 该 将 0 作为 指针 进行 处 
EE Se 

这 些 情 况 是 : 

口 没 有 原型 声明 的 函数 的 参数 
口 可 变 长 参数 函数 中 的 可 变 部 分 的 参数 

ANSIC 中 ， 因 为 引入 了 原型 声明 ， 只 有 在 你 确实 做 了 原型 声明 的 情况 
下 ， 编 译 器 才能 知道 你 “ 想 要 传递 指针 ”。 

可 是 ， 2 pn ntf() 为 代表 的 可 变 长 参数 函数 ， 其 可 变 部 分 的 参数 
的 类 型 编译 能 理解 的 。 另 外 糟糕 的 是 ， 在 可 变 长 参数 的 函数 中 ， 还 
经 常 使 用 常量 NULL 来 表示 参数 的 结束 (比如 UNIX 的 系统 调用 exec1() 
函数 )。 

以 上 情况 下 ， 简 单 地 传递 常量 0， 会 降低 程序 的 可 移植 性 





1.2 关于 指针 31 





因此 ,通过 使 用 宏 定义 NULL 来 将 0 强制 转型 成 void* ， 可 以 显 式 地 告 
之 编译 器 当前 的 0 为 指针 。 x* 关于 这 个 话题 ,在 C 
语言 FAQ( http://www. 
catnet.ne.jp/kouno/c fa 


1.2.6 ”实践 一 一 swap 涵 数 qfe_faqhtm ) 中 也 花 


费 了 一 章 的 笔墨 进行 
到 这 里 为 止 ， 已 经 对 指针 进行 了 大 致 的 介绍 ， 但 是 关于 指针 的 用 处 还 没 了 讨论 。 
有 解释 。 
在 这 里 , 我 们 使 用 经 常用 于 展示 指针 使 用 方法 的 例 程 一 一 招牌 的 swap 函 
数 来 进行 下 面 的 说 明 。 
下 面 这 个 函数 试图 交换 两 个 int 类 型 变量 的 值 ， 虽 然 这 个 例子 总 让 人 觉 
得 不 太 自然 ， 但 我 们 这 里 还 是 使 用 了 这 个 例子 。 


























void swap(int a, int b) 





{ 
int temp; 
temp = a 
a=b; 
b = temp; 
} 
让 我 们 调用 一 下 这 个 函数 。 
int x, y; 
X= 
y = 10; 
swap(x, y); 


printfC"x..%d y..%d\n", x, y); 
通过 运行 以 上 的 调用 ,我们 发 现 x 和 y 的 值 并 未 交换 。 

调用 C 的 函数 ， 参 数 传递 往往 是 传 值 ， 这 种 方式 传递 的 是 参数 的 副本 。 
可 能 会 有 人 这 样 想 : 


哈 ? 这 本 书 也 谈 传 值 的 问题 ? 以 前 俺 买 的 那些 C 语言 入 门 书 中 
也 有 这 个 内 容 呢 。 也 黑 ， 寻 且 先 听 你 说 说 看 ， 所 谓 的 传 值 究 竞 是 怎 
么 回 事 ? 


为 了 这 部 分 读者 ， 我 换个 角度 来 说 明 一 下 。 
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这 个 例子 中 的 swap 函数 ， 有 两 个 int 型 的 参数 。 所以, 也 一 定 可 以 通过 
下 面 的 方式 调用 这 个 函数 : 


swap(3, 5); 


那么 ,在 swap 这 一 边 ， 我 们 先 排 除 形 参 ( 这 里 是 a 和 b ) 在 调用 的 时 候 
被 设 定 值 的 情况 , 将 它们 和 通常 的 局 部 变量 同样 对 待 。 当然, 赋值 也 是 可 以 的 。 


假设 给 a 和 b 赋值 会 让 调用 方 的 变量 给 x 、y 带 来 影响 ,那么 像 swap(3 ,5) 
这 种 方式 的 调用 ， 究 竟 会 发 生 什 么 呢 ? 常量 3 变 成 5，5 变 成 3? 绝 不 可 能 。 


顺便 提 一 下 ， 有 一 些 C 语言 之 外 的 其 他 语言 ， 给 函数 的 形 参 赋值 是 会 影 
响 到 调用 方 的 实 参 的 。 在 以 前 的 FORTRAN 中 ， 所 有 的 参数 都 是 这 样 的 。 在 
将 常量 作为 参数 进行 传递 的 时 候 ， 稀 里 糊涂 地 给 形 参 赋 了 值 一 一 结果 有 可 能 
惨不忍睹 。 在 Pascal 中 ,为 了 不 给 调用 方 的 变量 带 来 影响 ， 在 定义 函数 的 时 
候 ， 特 别 地 指定 参数 为 变量 参数 。 如 果 试 图 给 变量 参数 指定 常量 ， 编 译 器 会 
报错 。 


C 语 言 里 完全 没有 这 样 的 现象 。 无 论 如 何 , 函数 的 形 参 都 和 调用 时 被 设 定 
值 的 局 部 变量 一 样 。 如 果 不 是 这 样 的 话 ， 就 会 背负 FORTRAN 那样 的 危险 ， 
或 者 像 Pascal 那样 在 语法 下 做 些 文章 。 从 C 语 言 的 发 展 过 程 来 看 , 采取 Pascal 
那样 麻烦 的 方式 是 不 可 能 的 。 

因此 , 在 C 里 面 想 要 改写 调用 方 的 变量 ， 可 采取 传递 指针 的 方式 。 


void swap(int *a，int *b) 
































{ 
int temp; 
temp = *a 
*a = *b; 
*b = temp 
} 
调用 方式 为 : 


swap(&x, &y); 


在 本 例 中 ， 向 函数 传递 指向 x 和 y 的 指针 ( 也 就 是 地 址 )。 尽 管 指针 是 通 
过 传 值 的 方式 进行 传递 的 ,但 由 于 在 swap 中 使 用 了 * 运 算 符 ， 所 以 通过 指针 
可 以 间接 访问 到 x 和 y。 向 swap 传递 的 是 地 址 ，x 和 y 自身 并 没有 移动 。 


给 大 家 举 一 个 例子 。 有 一 位 从 不 信任 部 下 ， 甚 至 神经 质 得 有 点 让 人 讨厌 
的 上 司 ， 每 当 他 向 部 下 分 配 任务 的 时 候 ， 总 是 将 复制 后 的 文档 交 给 部 下 。 这 
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些 部 下 无 论 多 么 地 努力 ， 也 不 可 能 调换 这 位 上 司 的 文件 柜 中 存在 的 “文档 A” 
和 “文档 B” 的 内 容 。 除 非 上 司 这 样 吟 只 他 的 部 下 :“ 给 我 将 书柜 果 个 地 方 的 
文档 A， 以 及 书柜 某 个 地 方 的 文档 B 调换 一 下 !” 如 果 告 知 了 文档 的 “地 点 ”， 
这 些 部 下 就 能 调换 文档 内 容 了 。 就 是 这 么 一 回 事 。 


如 果 换 个 方式 说 明 这 一 小 节 开 头 的 那个 例子 , 就 好 像 冷 不 丁 地 向 swap 函 
数 要 求 “ 帮 我 把 5 和 10 交换 过 来 ”。 
换 成 其 他 的 函数 ， 


a= 5; 
func(a); 




















或 

func(5) ; 
你 不 认为 它们 是 一 样 的 吗 ? 

后 面 的 那个 例子 向 swap 函数 提出 了 “请 交换 这 里 的 变量 和 那里 的 变量 ” 
的 要 求 。 显然 这 个 要 求 是 可 以 满足 的 。 

说 个 题 外 话 ， 如 果 仅 仅 是 需要 交换 整 型 变量 的 值 ， 完 全 不 使 用 临时 变量 
也 是 可 以 的 。 比 如 使 用 下 面 的 宏 定义 : 

#define SWAP(a, b) (a +=b, b=a-b, a -= b) 

在 这 种 方式 (还 可 以 使 用 异 或 运算 符 ) 下 ， 在 颠倒 使 用 同一 个 变量 时 ， 
这 个 程序 是 不 能 正常 运行 的 。 比 如 你 写 了 SWAP (a[i] ,a[j])， 并 且 恰 巧 1 == 
j， 那 我 只 能 恭喜 你 中 招 了 。 当 然 ， 如 果 你 能 担保 这 种 情况 永远 不 可 能 出 现 ， 
使 用 这 个 宏 也 未 尝 不 可 。 


如 果 到 现在 为 止 , 对 以 上 内 容 还 是 不 太 明 白 , 请 阅读 第 2 章 。 第 2 章 会 具 







































































复制 。 


Wh 
"Ty 充 形 参 和 实 参 


几乎 所 有 的 C 语言 的 入 门 书籍 中 ， 都 会 讲解 “ 形 参 ” 和 “ 实 参 ”的 概 
念 。 但 是 它们 还 是 经 常 被 轻易 混淆 。 
实 参 是 调用 函数 时 的 参数 。 
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func(5) ; 一 一 这 里 的 5 是 实 参 。 
形 参 是 接受 实 参 的 一 方 。 


void func(int hoge) 一 这 里 的 hoge 是 形 参 


{ 

} 

后 面 会 经 常 出 现 “ 形 参 ”、“ 实 参 ” 这 样 的 词 ， 请 大 家 一 定 注意 不 要 混 
消 它 们 。 


1.3 ”关于 数组 


1.3.1 运用 数组 
数组 是 指 将 固定 个 数 、 相 同类 型 的 变量 排列 起 来 的 对 象 。 
还 是 先 让 我 们 来 体验 一 把 (参照 代码 清单 .3 )。 


运行 结果 如 下 : 











&array[0] ... 0xbfbfd9d4 
&array[1]... 0xbfbfd9d8 
&array[2].. .0xbfbfd9dc 
&array[3]... Oxbfbfd9e0 
&array[4]... 0xbfbfd9e4 





代码 清单 1-3 array.c 





#include <stdio.h> 


1 

2 

3 int main(Cvoid) 
A 

5 int array[5]; 
6 int i; 

7 
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8: /* 为 数组 array 的 各 元 素 设 值 */ 

9: for (i = 0; i < 5; i++) { 

10: array[i] = i; 

i es } 

12: 

13: /* 输 出 数组 各 元 素 的 值 */ 

14: for (i = 0; i < 5; i++) { 

15: printf(C"%d\n", array[i]); 
16: } 

17: 

18: /* 输 出 数组 各 元 素 的 地 址 */ 

19: for (i = 0; i < 5; i++) { 

20 : printf("&array[%d]... %p\n", 
21: } 

22: 

23: return 0; 

24: } 





i, &array[i]); 








在 第 5 行 ， 声明 数组 类 型 变量 array。 








在 第 9~ 11 行 ,为 array 的 各 元 素 设 定 值 。 这 
给 array[0]， 将 1 赋 给 array[1] 








里 就 是 单纯 地 依次 将 0 赋 











在 第 14 ~ 16 行 ， 输 出 数组 各 元 素 的 值 ， 就 是 运 
在 第 19 ~ 21 行 ， 输 出 数组 各 元 素 的 地 址 。 观 察 
些 地 址 的 值 与 值 之 间 都 相差 4 个 字 节 。 


我 的 环境 中 ，int 的 长 度 正 好 是 4 个 字 节 ， 内 
所 示 。 





























Oxbfbfd9d4 
array[0] 
array[1] 


Oxbfbfd9d8 


Oxbfbfd9dc 
array[2] 


Oxbfbfd9e0 

array[3] 
Oxbfbfd9e4 

array[4] 





图 1-4 数组 在 内 存 中 的 布 


可 





行 结果 最 前 面 的 那 5 行 。 
输出 的 地 址 ， 可 以 发 现 这 


存 中 数组 的 布局 如 图 1-4 
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在 本 章 1.2.4 方 中， 曾经 提 到 “对 指针 加 N， 指 针 前 进 “ 当 前 指针 指向 的 
数据 类 型 的 长 度 x N ”的 原则 。 在 这 里 将 会 重新 提起 这 个 话题 ， 更 详细 的 说 
明 请 阅读 下 一 节 。 


补 
yx 充 C 的 数组 是 从 0 开始 的 


使 用 C 语言 ， 声 明 一 个 数组 变量 : 





int hoge[10] ; 


这 里 指定 的 10 是 数组 元 素 的 个 数 , 因为 在 C 中 , 数组 的 下 标 从 0 开始 ， 
通过 上 面 这 个 声明 ， 你 可 以 使 用 hoge[0] 一 hoge[9] ， 但 你 不 能 使 用 
hoge[10] 。 

这 个 规则 经 常会 让 菜鸟 们 犯 迷糊 。 

FORTRAN 的 数组 就 是 从 1 开始 的 ， 要 是 C 跟 FORTRAN 一 样 那 该 多 
好 …… 有 读者 会 这 么 想 吧 ? 

这 样 真 的 好 吗 ? 我 觉得 你 需要 三 思 而 行 。 

打 个 比方 ， 我 上 班 的 公司 位 于 名 古 屋 的 一 座 5 层 的 写字 楼 里 ， 假 设 某 
人 每 怜 一 层 楼 花费 10 秒 钟 ， 那 么 此 人 如 果 从 地 面 朴 上 楼， 一 共 需 要 多 少 
秒 呢 ? 50 秒 ? 燕 喜 你 ， 答 错 了 ， 答 案 是 40 秒 。 

相信 大 家 在 中 学 里 都 学 过 “等 差 数 列 ”， 等 差 数 列 第 nn 项 等 于 “ 初 项 十 
公差 x (n-1)”。 

“1900 年 代 ”? 不 是 19 世纪 ， 它 的 一 大 半 属 于 20 世纪 。 更 让 人 纠结 的 
是 ，2000 年 不 属于 21 世纪 ， 而 属于 20 世纪 。 

对 于 这 些 现象 ， 如 果 把 
口 写字 楼 和 地 面相 同 高 度 的 那 层 ， 计 数 为 0 层 ， 

口 数列 最 初 的 项 ， 计 数 为 0 项， 
口 最 初 的 世纪 计数 为 0 世纪 ， 公 历 最 初 的 年 计数 为 0 年 ， 
就 能 够 回避 问题 。 

平时 编程 中 ， 也 经 常 发 生 “ 差 1 错误 ”问题 。 普 遍 的 观点 是 使 用 0 作 
为 基准 进行 编号 。 

如 果 还 是 有 人 不 太 理解 ， 可 以 再 举 一 个 和 编程 相关 的 例子 。 

C 语言 中 可 以 使 用 二 维 数 组 ( 准确 地 说 应 该 是 “数组 的 数组 ”)， 但 必 
须 在 编译 的 时 候 知道 二 维 数组 的 宽度 。 




















(“x xxx 年 代 ” 是 日 本 的 年 代表 达 方 式 ,“1900 年 代 ” 指 1900 ~ 1999 年 。 一 一 译 者 注 
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假设 我 们 执意 要 用 一 维 数组 去 代替 宽度 可 变 的 二 维 数组 使 用 ， 


/* width 为 行 的 宽度 ， 引 用 第 1ine 行 ， 第 CO1 列 的 元 素 */ 
array[line * width + col] 


假设 最 初 的 行为 第 1 行 ， 最 初 的 列 为 第 1 列 ， 并 且 数 组 的 下 标 是 从 1 
开始 ， 就 需要 把 上 面 的 代码 修改 成 下 面 这 样 ， 


array[(line-1) * width + (col-1)] 


C 的 数组 下 标 从 0 开始， 还 有 一 个 语法 上 的 原因 (后 面 会 提 到 )。 
如 果 你 使 用 习惯 了 ， 从 0 开始 的 数组 比 起 从 1 开始 的 数组 ， 使 用 起 来 
方便 得 多 。 


反正 如 今 的 内 存 已 经 很 大 了 ， 还 不 如 声明 数组 的 时 候 多 一 
元 素 的 长 度 ， 下 标 就 可 以 从 1 开始 使 用 了 。 


比 起 这 种 敷衍 了 事 的 想法 ， 我 们 还 不 如 让 自己 习惯 于 从 0 开始 使 用 数组 ， 
除非 你 正在 做 FORTRAN 程序 的 移植 工作 。 





1.3.2 ”数组 和 指针 的 微妙 关系 


正如 之 前 说 明 的 那样 ， 给 指针 加 N， 指 针 前 进 “ 当 前 指针 指向 的 变量 类 
型 的 长 度 x N”。 

因此 ， 给 指向 数组 的 某 个 元 素 的 指针 加 N 后 ， 指 针 会 指向 N 个 之 后 的 
元 素 。 








代码 清单 1-4 array2.c 





1 #include <stdio.h> 

2 

3 int main(Cvoid) 

4: { 

5 : int array[5]; 

6 int *p; 

7 int 1 ; 

8 : 

9: /* 给 数组 array 的 各 元 素 设 定 值 */ 
10: for (1 = 0; 1 < 5; i++) { 
11: array[i] = i; 

12: 
13: 
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14: /+* 输 出 数组 各 元 素 的 值 (指针 版 ) */ 
15: for (p = &array[0]; p != &array[5]; p++) { 
16: printfC"%d\n", *p); 
17: } 
18 
19: return 0; 
20: 1} 





运行 结果 如 下 。 可 以 发 现 运行 结果 和 代码 清单 1-3 的 前 半 部 分 相同 。 














从 第 15 行 开 始 一 个 for 循环 ， 最 初 指针 p 指向 array[0] ， 通 过 p++ 顺 
序 地 移动 指针 ， 引 导 指 针 指向 array[5] (尽管 它 不 存在 ) (请 参照 图 1-5 )。 





@ 一 边 给 p 加 1， 
边 输 出 *p 





@ 一 旦 指向 了 
array [5], 
就 结束 循环 





(实际 上 不 存在 array [5]) 


图 1-5 利用 指针 输出 数组 的 值 





使 用 ++ 运 算 符 给 指针 加 1， 指 针 前 进 sizeof(int) 个 字 节 。 
此 外 ,第 15 ~ 17 行 的 代码 也 可 以 换 一 种 写法 ( 我们 可 以 称 之 为 “改写 版 ” )。 


/* 利 用 指针 输出 数组 各 元 素 的 值 一 一 改写 版 */ 

p = &array[0]; 

for (i = 0; i < 5; i++) { 
printfC"%d\n", *(p + 1)); 

} 


这 种 写法 里 ， 指 针 并 没有 一 步 步 前 进 ， 而 是 固定 的 ， 只 是 在 打印 的 时 
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候 加 ji。 

话说 回来 ， 你 觉得 这 种 写法 容易 阅读 吗 ? 

至 少 在 我 看 来 ， 无 论 写 成 p++， 还 是 *(p + 1) ， 都 不 容易 阅读 。 还 是 最 
初 的 例子 中 a[i] 这 样 的 方式 更 容易 理解 。 

实际 上 ， 本 书 主张 的 是 “因为 利用 指针 运算 的 写法 不 容易 阅读 ， 所 以 让 
我 们 抛弃 这 种 写法 吧 ”。 

先 把 写法 好 坏 的 问题 放 在 一 边 。 事 实 上 ， 指 针 运 算是 C 语言 的 一 个 “ 奇 
怪 ” 的 功能 。 到 底 有 多 “奇怪 ”， 片 刻 之 后 就 为 你 一 一 道 来 。 














1.3.3 下 标 运 算 符 [] 和 数组 是 没有 关系 的 
在 前 一 小 节 的 “改写 版 ” 例 程 中 , 像 下 面 这 样 将 指针 指向 数组 的 初始 元 素 。 
p = &array[0] ; 

其 实 也 可 以 写成 下 面 这 样 : 
p = array; 


对 于 这 种 写法 ， 很 多 C 语言 的 入 门 书籍 是 这 样 说 明 的 : 























在 C 中 ， 如 果 在 数组 名 后 不 加 [] ， 单 独 地 只 写 数 组 名 ， 那 么 此 
名 称 就 表示 “指向 数组 初始 元 素 的 指针 ”。 


在 这 里 ， 我 可 以 负责 地 告诉 你 ， 上 面 的 说 明 是 错误 的 。 
又 惊 着 你 了 吧 ? 


在 C 的 世界 里 ， 事 到 如 今 你 再 去 否定 “数组 名 后 不 加 [] ， 就 代表 指向 初 
台 元 素 的 指针 ”这 个 “强大 的 ”误解 显得 有 点 无 奈 。 对 于 这 种 已 经 深入 人 





























心 的 观点 ， 你 突然 放言 它 其 实 是 个 误解 ， 可 能 很 多 人 无 法 接受 。 下 面 让 我 们 
依法 来 证 明 。 
将 &array[0] 改 写成 array,“ 改 写 版 ”的 程序 甚至 可 以 写成 下 面 这 样 : 
p = array; 一 一 只 是 改写 了 这 里 ， 可 是 …… 


for (1 = 0; 1 < 5; i++) { 
printf(C"%d\n", *(p + 1)); 
} 


另外 ， 程 序 中 *(Cp + 1i) 也 可 以 写成 p[i]。 


# 如 果 考 虑 给 人 留 点 面 
子 ， 其 实 我 应 该 这 么 
说 :“ 不 能 说 这 个 说 明 
总 是 对 的 。” 可 是 考虑 
一 下 听 到 这 个 说 明 的 
和 人 如 何 解释 它 ,就 感觉 
还 不 如 痛 痛 快 快 地 指 
出 来 “这 个 说 明 完 全 是 
错误 的 ”。 
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p = array; 

for (i = 0; 1 < 5; i++) { 

printfC"%d\n", p[i]); 

也 就 是 说 ， 

*(p + i) 
和 

p[i] 
是 同样 的 意思 。 可 以 认为 后 面 的 写法 是 前 面 的 简便 写法 。 

在 这 个 例子 中 ， 最 初 通过 p = array; 完 成 了 向 p 的 赋值 ， 但 之 后 p 一 直 
没有 发 生 更 改 。 所 以 , 早 知 如 此 , 何必 当初 偏 要 多 声明 一 个 p, 还 不 如 一 开始 
就 写成 array 呢 。 


for (i = 0; i < 5; i+t+) { 
printf("%d\n", array[i]); 









































} 

呀 ， 好 像 又 回去 了 呢 。 
结论 就 
p[i] 

这 种 写法 只 不 过 是 
*(p + 1) 

这 种 写法 的 简便 写法 ， 除 此 之 外 ， 它 毫 无 意义 。array[i] 和 p[i] 有 什么 不 一 

样 吗 ? array[i] 也 可 以 像 p[i 一 样 ， 将 array 解读 成 “指向 数组 的 初始 元 

素 的 指针 ”。 

也 就 是 说 ， 存 在 
int array[5]; 

这 样 的 声明 的 时 候 ,，“ 一 旦 后 面 不 追加 [] ， 只 写 array” 并 不 代表 要 使 array 

具有 指向 数组 第 1 个 元 素 的 指针 的 含义 ， 无 论 加 不 加 [] ， 在 表达 式 中 ， 数 组 

都 可 以 被 解读 成 指针 。 
顺便 说 一 下 ， 对 于 这 个 规则 来 说 ， 有 三 个 小 的 例外 ， 我 们 会 在 第 3 章 作 

详细 说 明 。 

你 可 以 认为 这 是 一 个 哗众取宠 的 异端 那 说 ， 但 至 少 在 语法 上 ， 数 组 下 标 








先 
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运算 符 [] 和 数组 无 关 。 
这 里 也 是 C 的 数组 下 标 从 0 开始 的 理由 之 一 。 


要 点 

【 非常 重要 !! 】 

表达 式 中 ， 数 组 可 以 解读 成 “指向 它 的 初始 元 素 的 指针 ”。 尽 管 有 三 个 小 例 
外 ， 但 是 这 和 在 后 面 加 不 加 [] 没 有 关系 。 


要 点 
p[i] 是 x*Cp + i) 的 简便 写法 。 
下 标 运 算 符 [] 原 本 只 有 这 种 用 法 ， 它 和 数组 无 关 。 




















需要 强调 的 是 , 认为 [] 和 数组 没有 关系 , 这 里 的 [] 是 指 在 表达 式 中 出 现 的 
下 标 运算 符 []。 


声明 中 的 [] ， 还 是 表达 数组 的 意思 。 也 就 是 说 ， 声 明 中 的 [] 和 表达 式 中 
的 [意义 完全 不 同 。 表 达 式 中 的 x* 和 声明 中 的 x 的 意义 也 是 完全 不 同 的 。 这 些 
现象 使 得 C 语言 的 声明 在 理解 上 变 得 更 加 扑朔迷离 …… 对 此 ， 第 3 章 将 会 进 
行 详 细 的 说 明 。 
此 外 ， 如 果 将 a + b 改写 成 b + a， 表 达 式 的 意义 没有 发 生 改 变 ， 所 以 
你 可 以 将 *(Cp + i) 写成 x(i + p)。 其 次 ， 因 为 p[ 订 是 *(Cp + 1 的 简便 写法 ， 
实际 上 它 也 可 以 写成 1[p]。 
引用 数组 元 素 的 时 候 ， 通 常 我 们 使 用 array[5] 这 样 的 写法 。 其 实 ， 就 算 
你 写成 5[array] ， 还 是 可 以 正确 地 引用 到 你 想 要 的 元 素 。 可 是 ， 这 种 写法 实 
在 太 另 类 了 ， 它 不 能 给 我 们 带 来 任何 好 处 。 
要 点 
p[ 订 可 以 写成 1[p]。 















































要 点 
【 比 上 面 这 个 要 点 更 重要 的 要 点 】 
但 是 别 写成 那样 。 
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二 
8 补 ， 语法 入 


# 关于 这 方面 的 论述 在 
“The Development of 
the C Language” 品 这 
篇 论文 ( 也 可 以 认为 是 

随笔 吧 ) 中 有 记载 。 你 

可 以 从 Dennis Ritchie 

9 网 站 上 获取 它 。 





* 因此 ,在 B 中 ,将 p[i] 
写成 i[p] 是 一 件 “ 理 
所 当然 ”的 事 。 但 是 这 
种 规则 居然 被 原封 不 
动 地 搬 到 了 C 中 (有 
点 悲 说! )。 


p[i] 是 x*(p+i) 的 简单 写法 ， 实际 上 ， 至少 对 于 编译 器 来 说 ,，[] 这 样 的 
运算 符 完 全 可 以 不 存在 。 

可 是 ， 对 于 人 类 来 说 ，*(p + i) 这 种 写法 在 解读 上 比较 困难 ， 写 起 来 
也 麻烦 (键入 量 大 )。 因 此 ，C 语 言 引入 了 [] 运 算 符 。 

就 像 这 样 ， 这 些 仅仅 是 为 了 让 人 类 容易 理解 而 引入 的 功能 ， 的 确 可 以 
让 我 们 感受 到 编程 语言 的 锁 密 味道 (容易 着 手 )， 有 时 我 们 称 这 些 功 能 为 语 
法 糖 ( syntax sugar 或 者 syntactic sugar )。 


1.3.4 ”为 什么 存在 奇怪 的 指针 运算 

如 果 试 图 访问 数组 的 内 容 ， 老 老实 实地 使 用 下 标 就 可 以 了 。 为 什么 存在 
§ 针 运算 这 样 奇 怪 的 功能 呢 ? 

其 中 的 一 个 原因 就 是 受到 了 C 的 祖先 B 语言 的 影 

在 1.1.2 市 的 补充 内 容 中 也 提 到 了 ，B 是 一 种 “没有 类 型 ”的 语言 。B 中 
可 以 使 用 的 类 型 只 有 word 型 (也 就 是 整 型 ), 指针 也 是 作为 整 型 来 使 用 的 ( 像 
浮 点 型 这 样 高 级 的 事物 ， 你 根本 见 不 到 )。B 是 虚拟 机 上 运行 的 解释 器 ， 这 个 
虚拟 机 以 word 为 单位 分 配 内 存 地 址 (如今 普通 的 计算 机 以 字 节 为 单位 )。 

由 于 B 以 word 为 单位 , 如 果 指 针 ( 仅仅 是 表现 地 址 的 简单 的 整数 ) 加 1， 
指针 就 指向 数组 的 下 一 个 元 素 。 为 了 继承 这 种 特性 ，C 引入 了 “指针 加 1, 指 
针 前 进 它 所 指向 类 型 的 长 度 ” 这 个 规则 ”。 

B 语 言 中 同样 存在 p[i] 是 x*(p + i) 的 语法 糖 这 样 的 规划。 可 是 ， 这 里 的 
(p + i) 只 不 过 是 单纯 的 整数 之 间 的 加 法 运算 *。 

解 引用 *、 地 址 运算 符 &， 也 以 几乎 和 C 相 同 的 形态 存在 于 B 语 言 中 。 

另外 还 有 一 个 理由 就 是 ， 早 先 使 用 指针 运算 可 以 写 出 高 效 的 程序 。 

通常 情况 下 ， 我 们 总 是 使 用 循环 语句 来 处 理 数 组 ， 一 般 都 写成 下 面 的 } 
形式 ， 

for (i = 0; 1 < LOOP_MAX; i++) { 


/* 
# 在 这 里 ， 使 用 array[i] 进 行 各 种 各 样 的 处 理 。 























可 


0 
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* array[i] 会 出 现 多 次 。 
*/ 


} 
array[i 在 循环 中 会 出 现 多 次 ， 每 次 都 要 进行 相当 于 *(array + i) 的 加 
法 运算 ,效率 自然 比较 低 。 
因此 ， 可 以 使 用 指针 运算 重 写 上 面 这 段 循环 ， 
for (p = &array[0]; p != &array[LOOP_MAX]; p++) { 
a 


*p 会 出 现 多 次 。 
/ 


* 
* 








} 
尽管 *p 在 循环 内 部 会 出 现 多 次 ,但 加 法 运算 只 有 在 循环 结束 的 时 候 执 行 
一 次 。 


K&R p.119 中 叙述 了 “一 般 情 况 下 ， 使 用 指针 的 程序 比较 高 效 "。 上 面 的 
说 明 应 该 可 以 作为 这 段 叙 述 的 根据 吧 。 


可 是 ， 这 些 无 论 怎 样 都 是 老 黄历 了 。 
公 


如 今 ， 编 译 需 在 不 断 地 被 优化 ， 对 于 循环 内 部 重复 出 现 的 表达 式 的 集中 处 
理 ， 是 编译 器 优化 的 基本 内 容 。 对 于 现在 一 般 的 C 编译 器 ， 无 论 你 使 用 数组 还 
是 指针 ， 效 率 上 都 不 会 出 现 明显 的 差距 。 基 本 上 都 是 输出 完全 相同 的 机 器 码 。 


总 的 来 说 ，C 的 指针 运算 功能 的 出 现 ， 源 自 于 早期 的 C 自身 没有 优化 手 
段 。 这 一 点 并 不 奇怪 , 请 大 家 回想 一 下 在 前 面 介绍 过 的 内 容 , C 本 来 只 是 为 了 
解决 开发 现场 的 人 们 眼前 的 问题 而 出 现 的 一 种 语言 -Unix 之 前 的 OS 几乎 都 是 
使 用 汇编 写 的 ， 即 使 星 涩 难 懂 ， 人 们 也 不 会 大 惊 小 怪 。 对 于 当时 的 环境 ， 追 
求 什么 编译 费 优 化 实在 有 点 勉 为 其 难 。 因 此 ， 当 初 开发 C 语言 的 上 时候， 是 完 
全 有 必要 提供 指针 运算 功能 的 。 可 是 …… 

























































































1.3.5 不 要 小 用 指针 运算 

被 称 为 C 语言 宝典 的 K&R 指出 : “一般 情况 下 ， 使 用 指针 的 程序 比较 高 
效 。” 这 完全 是 “那个 时 代 的 错误 ”。 

可 是 ， 正 如 前 面 所 说 ， 对 于 如 今 的 编译 器 ， 无 论 是 使 用 指针 运算 还 是 下 
标 运 算 ， 都 生成 几乎 完全 相同 的 执行 代码 。 
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# 下 标 运算 符 也 是 “指针 


党 


运算 + 解 引 用 运算 
符 "， 这 里 提 到 的 “ 指 
针 运 算是 指明 确 地 对 
指针 进行 加 减 运 算 的 


特别 是 ， 在 这 段 代码 
中 ， 当 循环 结束 后 指 
针 指向 了 空 字符 的 下 
一 个 字符 ,之 后 如 果 继 
续 复制 其 他 字符 惠 ,会 
很 容易 诱发 bug。 











事 到 如 今 …… 难 道 不 应 该 放弃 使 用 指针 运算 "， 老 老实 实地 使 用 下 标 访 
问 吗 ? 


虽然 K&R 被 很 多 人 奉 为 “ 神 书 ”"， 可 是 对 于 我 来 说 ， 它 连作 为 菜 乌 实 习 
的 资料 也 不 够 格 。 为 什么 这 么 说 ”因为 在 此 书 中 ， 那 些小 用 指针 的 例 程 完全 
可 以 让 你 月 演 。 








莫名 其 妙 地 使 用 像 *++args[0] 这 样 的 语句 , 并 且 乐 此 不 疲 , 实在 让 人 心烦 。 
KCR 里 面 记载 了 下 面 这 个 作为 strcpyO 实 现 的 例子 : 


/* Strcpy: 将 七 复制 到 S ;指针 版 3 */ 
void strcpy(char *s, char *t) 
{ 


while (#*Ss++ = *t++) 





虽然 乍 一 看 不 容易 理解 ， 但 是 这 种 写法 其 实 是 非常 方便 的 。 因 
为 会 在 C 程序 中 经 常 遇 到 ， 所 以 我 们 应 该 掌握 这 种 惯用 写法 。 


既然 知道 “ 乍 一 看 不 容易 理解 "， 那 就 不 应 该 这 样 写 ， 难 道 不 是 吗 ?“ 
满 大 街 的 C 语言 人 门 书 都 在 教育 我 们 , 使 用 指针 运算 比 使 用 下 标 会 让 程序 


口 更 有 效率 
口 更 有 C 语言 范 儿 
所 谓 的 “更 有 效率 ”， 只 不 过 是 及 想 墨 了 。 对 于 这 种 “微不足道 的 ”优化 
工作 ,与 其 让 人 去 小 心 缀 经 地 做 ,还 不 如 交 给 编译 器 来 干 。 
所 谓 “ 更 有 C 语言 范 儿 ”好 像 是 有 些 道理 。 如 果 只 是 为 了 要 让 程序 “有 
范 儿 ”， 而 让 代码 变 得 上 涩 难 懂 ， 那 么 还 是 拜托 你 行 行 好 ， 扔 掉 这 种 恶习 吧 。 
在 学 校 里 ， 我 们 要 完成 一 些 课 后 作业 。 好 不 容易 完成 了 一 个 使 用 下 标的 
程序 题 ， 不 料 后 面 的 那 道 题 为 “请 使 用 指针 将 刚才 那 道 题 的 程序 重新 完成 一 
壳 ”。 这 种 事 常 有 取 。 
老实 说 ， 这 种 事 很 无 聊 。 也 许 你 会 很 “威武 ”地 依然 使 用 下 标 原封 不 动 
地 把 程序 又 写 了 了 一遍 ， 然 后 交 给 了 老师 。 面 对 老师 的 指责 ， 你 义 正 辞 严 ; 



















































































呈 ， 下 标 运 算 符 [] 只 不 过 是 指针 运算 的 语法 糖 而 已 ， 在 本 质 上 
样 的 写法 也 是 在 使 用 指针 啊 。 


要 
尽管 这 样 ， 























这 位 可 爱 的 老师 可 能 还 是 不 会 放 过 你 ， 于 是 你 就 急 了 : 
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行 ， 不 就 是 把 像 p[i] 这 样 使 用 下 标的 地 方 ， 机 械 地 一 个 个 替换 

成 *(p+i) 嘛 。 

话说 回来 ， 丢 了 学 分 ， 我 可 不 负责 哟 。 在 C 的 世界 里 ， 使 用 指针 运算 要 
比 使 用 下 标的 写法 让 人 感觉 更 “ 帅 一 些 ”。 

但 是 …… 与 其 在 这 些 无 聊 的 地 方 “ 砚 酷 ”， 倒 不 如 多 花 点 时 间 学 一 些 有 用 
的 知识 。 你 要 知道 ， 作 为 一 个 程序 员 ， 还 有 堆积 如 山 的 知识 等 着 你 去 掌握 呢 。 

当然 ， 什 么 样 的 规则 都 有 例外 ， 比 如 ， 在 “一 个 巨大 的 char 数组 中 ， 参 
杂 了 各 种 类 型 的 数据 *, 并 且 我 们 试图 读 取 第 多 少 字 节 的 数据 ”这样 的 情况 下 ， 
还 是 使 用 指针 运算 写 的 程序 比较 容易 理解 。 

此 外 ， 作 为 一 个 C 程 序 员 连 指针 运算 的 代码 也 读 不 懂 ， 多 少 有 点 可 翡 。 


尽管 如 此 ， 让 我 们 至 少 从 现在 开始 尽量 使 用 下 标 来 写 新 的 程序 ， 这 样 做 
对 自己 ， 以 及 对 以 后 有 机 会 阅读 你 的 程序 的 人 ， 都 有 好 处 。 










































































他? 补 
馈 充 修改 参数 ， 好 吗 ? 


刚才 那个 在 K&R 中 记载 的 实现 strcpy() 的 例子 中 ， 使 用 ++ 直 接 修改 
了 形 参 s 和 七 的 值 。 

确实 ，C 的 形 参 可 以 和 事先 被 设 定 值 的 局 部 变量 同样 使 用 ， 对 值 进 行 
修改 在 语法 上 并 没有 任何 问题 。 但 我 从 来 不 这 么 做 。 

吕 数 的 参数 是 从 调用 方 得 到 的 非常 重要 的 信息 ， 如 果 一 时 疏忽 错误 地 
修改 了 参数 ， 就 再 也 恢复 不 了 了 。 对 于 在 后 面 追加 新 的 逻辑 ， 或 者 调试 程 
序 的 情况 下 ， 因 为 原始 的 参数 已 经 被 修改 ， 如 果 想 要 看 一 下 参数 的 值 ， 你 
会 感觉 非常 棘手 。 

此 外 ,参数 都 应 该 有 一 个 有 意义 的 名 称 ( 刚才 的 strcpy() 是 个 反面 教 
材 ), 在 修改 参数 的 时 候 , 违背 最 初 参数 名 称 的 意义 的 “ 恶 行 ”也 屡见不鲜 。 

顺便 说 一 下 ，Ada 和 Eiffel 不 允许 修改 作为 输入 信息 的 函数 参数 。 


1.3.6 试图 将 数组 作为 函数 的 参数 进行 传递 


在 这 里 ， 让 我 们 首先 来 做 一 个 具有 实用 价值 的 例子 : 从 英文 的 文本 文件 
































g 在 网 络 通讯 中 , 数据 交换 程序 中 经 常会 使 用 一 个 char 数组 保存 各 种 数据 类 型 的 数据 。 我 
们 通常 将 这 种 行为 称 为 序列 化 。 一 一 译 者 注 














# 这 种 恶 行 多 发 生 在 循 
环 计数 的 逻辑 中 。 

# 在 内 部 ,我 认为 应 该 是 
和 C 采用 了 大 抵 相 同 
的 参数 传递 方式 。 
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中 将 单词 一 个 一 个 取出 来 。 

关于 调用 方式 ， 模 仿 fgets() ， 定 义 成 下 面 的 形式 : 

int get_word(Cchar *buf, int buf_size, FILE *fp); 

函数 的 返回 值 是 单词 的 字母 个 数 ， 当 读 到 文件 末尾 的 时 候 返 回 EOF。 

对 于 单词 的 定义 ， 如 果 仔 细 考 虑 一 下 ， 好 像 还 真 不 是 件 容易 的 事 。 这 
我 们 选择 使 用 C 的 1salnum() 这 个 宏 (ctype.h )。 如 果 返 回 真 ， 就 表示 是 连 纪 
的 几 个 字符 那 就 作为 单词 ， 否 则 就 是 空白 字符 。 

单词 长 度 大 于 buf_size 的 情况 下 , 因为 处 理会 变 得 比较 麻烦 , 我 们 考虑 
使 用 exitGO 果 上 断 地 结束 程序 。 

为 了 测试 这 个 函数 ， 在 程序 中 添加 main() 用 来 驱动 测试 过 程 (调用 
get_word() ) (参照 代码 清单 1-5 )。 


main() 中 声明 的 数组 buf， 在 get_word() 中 被 填充 值 。 


在 mainG@O 中 ，buf 作为 函数 的 参数 传递 ， 因 为 这 里 是 在 表达 式 中 ， 所 以 
buf 可 以 解读 成 “指向 数组 初始 元 素 的 指针 ”。 因 此 , 接受 buf 的 get_wordO) 
才 可 以 像 

int get_word(Cchar *buf, int buf_size, FILE *fp) 

这 样 ， 合 法 地 接受 char *。 
其 次 ,在 get_word() 中 ， 可 以 像 buf[1en] 这 样 操作 buf 的 内 容 。 那 是 


因为 buf[1en] 是 *Cbuf + 1en) 的 语法 糖 


一 旦 在 get_word 中 使 用 下 标 运 算 符 访问 buf 的 内 容 ， 倒 还 真 的 会 让 人 
感觉 从 mainO 〇 传递 过 来 的 是 buf 这 样 的 数组 。 显 然 这 是 个 错觉 ， 无 论 如 何 ， 
从 mainG) 传 递 过 来 的 是 指向 buf 的 初始 元 素 的 指针 ( 请 回忆 一 下 我 们 曾经 提 
到 的 “C 是 本 来 只 能 使 用 标量 的 语言 ”这 个 观点 ， 参 照 1.1.8 节 )。 





温 晤 







































































代码 清单 1-5 get_word.c 





#include <stdio.h> 
#include <ctype.h> 
#include <stdlib.h> 


int get_word(char *buf, int buf_size, FILE *fp) 
{ 


NOUUPAWUDNTDP 


int len; 
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8: int ch; 

9: 

10: /* 跳 过 读 取 空白 字符 */ 

11: while ((ch = getc(fp)) != EOF && !isalnum(ch)) 
12: o 

13: if (ch == EOF) 

14: return EOF; 

15: 

16: /* 此 时 ，Ch 中 保存 了 单词 的 初始 字符 。*/ 

17: len = 0; 

18: do { 

19: buf[len] = ch; 

20 : len+t+; 

2 if (len >= buf_size) { 

22: /* 由 于 单词 太 长 ， 提 示 错 误 */ 

23: fprintf(stderr, "word too long.\n"); 
24: exit(1); 
25: } 
26 : } while ((ch = getc(fp)) != EOF && isalnum(ch)); 
27: buf[len] = '\0'; 
28: 
29 : return len; 

30: 了】 

31: 

32: int main(Cvoid) 

33: {{ 

34: char buf[256]; 

35 : 

36 : while (get_word(buf, 256, stdin) != EOF) { 
3 了 printf("<<%s>>\n", buf); 

38: } 

39 : 
40 : return 0; 
41: } 




















准确 地 说 ， 在 C 中 是 不 能 将 数组 作为 函数 参数 进行 传递 的 。 但 是 ， 你 可 
以 通过 传递 指向 初始 元 素 的 指针 来 达到 将 数组 作为 参数 进行 传递 的 目的 。 


要 点 
如 果 试图 将 数组 作为 函数 参数 进行 传递 ， 那 就 传递 指向 初始 元 素 的 指针 。 


可 是 , 一 般 情况 下 将 int 等 作为 参数 进行 传递 的 时 候 ， 与 在 当前 的 例子 
中 将 数组 作为 参数 进行 传递 的 时 候 ， 它 们 的 传递 方式 是 完全 不 同 的 。 


在 C 中 ， 函 数 参数 传递 都 是 传 值 ， 向 函数 传递 的 都 是 参数 的 副本 。 当 前 
的 例子 同样 如 此 ， 向 get_wordQ) 传 递 的 是 指向 buf 初始 元 素 的 指针 的 副本 。 
但 是 ，main() 和 get_word(C) 引 用 的 都 是 buf 本 身 ， 而 不 是 buf 的 副本 。 正 
因为 如 此 ，get_wordG) 才 能 正确 地 向 buf 填充 字符 串 的 内 容 。 
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补 
[a 充 如 果 对 数组 进行 值 传递 


在 迫不得已 的 情形 下 ， 如 果 你 执意 要 将 数组 的 副本 作为 参数 进行 传递 ， 可 
以 使 用 替代 方法 一 将 数组 的 所 有 元 素 整理 成 结构 体 的 成 员 。 

正如 1.1.8 节 中 说 明 的 那样 ，C 本 来 就 是 只 能 使 用 标量 的 语言 。 但 是 这 
个 问题 在 比较 早 的 时 期 就 得 到 了 改善 ， 我 们 现在 已 经 可 以 对 结构 体 进行 赋 
4 

可 是 ， 这 种 方法 在 效率 上 是 有 问题 的 ， 关 于 这 一 点 你 需要 有 心理 准备 。 
当 在 操作 一 个 巨大 的 数组 的 时 候 ， 如 果 对 所 有 元 素 一 一 复制 ， 那 可 是 非常 
耗 时 的 。 

我 以 前 在 模拟 奥赛 罗 棋 游戏 "的 行 棋 思 路 的 时 候 ， 曾 经 通过 这 种 方法 来 
对 表示 盘面 形势 的 二 维 数组 进行 值 传递 。 在 行 棋 思 路 中 ， 通 过 对 “如 果 这 
样 下 ， 和 形势 就 会 这 样 ”的 巨大 的 树 结构 进行 不 断 地 递归 探寻 ， 来 得 到 最 优 
的 出 棋 对 策 ， 因 此 ， 针 对 每 一 着 棋 都 需要 对 记录 盘面 形势 的 二 维 数组 进行 
复制 。 我 感觉 ， 也 就 是 在 这 种 需求 下 才 会 使 用 这 种 技术 。 


要 点 
无 论 如 何 都 要 将 数组 进行 值 传递 的 时 候 ， 建 议 将 数组 整体 整理 成 结构 体 
成 员 。 


1.3.7 ”声明 函数 形 参 的 方法 
本 书 的 例 程 中 ， 将 get_word0) 的 参数 像 下 面 这 样 使 用 char * 进 行 声明 ， 
int get_word(char *buf, int buf_size, FILE *fp) 
“ 呈 ? 俺 可 是 一 直 这 么 写 的 哦 ” 
int get_word(char buf[], int buf_size, FILE *fp) 
应 该 有 同学 是 这 样 想 的 吧 。 
只 有 在 声明 函数 形 参 时 ， 数 组 的 声明 才 可 以 被 解读 成 指针 。 
比如 ， 对 于 


int func(Cint ar]) 







































































人 奥赛 罗 棋 是 一 种 双人 棋盘 游戏 。 在 划分 64 格 的 棋盘 上 排列 正 反面 为 黑白 色 的 圆 形 棋子 ， 
夹 住 对 方 棋子 时 可 把 它 翻 面 换 成 己方 的 棋子 的 颜色 ， 以 此 争 胜 负 。 一 一 译 者 注 
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编译 器 可 以 针对 性 地 解读 成 : 

int funcCint *a) 
即使 像 下 面 这 样 定义 了 元 素 个 数 ， 编 译 器 也 是 无 视 的 ， 
int funcCint a[10]) 


这 也 是 语法 糖 之 一 。 


















































必须 要 引起 注意 的 是 ，int a[] 和 int *a 具有 相同 意义 ,在 C 的 语法 中 
只 有 这 么 一 种 情况 。 关 于 这 一 点 ， 在 第 3 章 中 会 有 具体 的 说 明 。 





要 点 

在 下 面 声明 的 形 参 ， 都 具有 相同 的 意义 。 
int funcCint *a); /* 写 法 1*/ 
int funcCint a[l); /* 写 法 2*/ 


int func(Cint a[10]); /* 写 法 3*/ 
写法 2 和 写法 3 是 写法 1 的 语法 糖 。 


补 
名 充 C 语言 为 什么 不 做 数组 下 标 越界 检查 ? 


通常 ，C 对 数组 的 长 度 范围 是 不 做 检查 的 。“ 托 它 的 福 ”， 当 向 数组 越 
界 写 入 数据 的 时 候 ， 经 常 产生 “ 内 存 被 破坏 ”的 问题 。 如 果 在 较 早 的 阶段 ， 
操作 系统 发 现 异 常 并 且 提 示 Segmentation fault, 或 者 “强制 关闭 异常 的 应 用 
程序 ”这 样 的 消息 还 算 幸 运 。 最 不 幸 的 是 ， 相 邻 变量 的 值 已 经 被 破坏 ， 程 
序 却 还 在 继续 运行 ， 并 且 你 无 法 预知 悲剧 会 在 何 时 何 地 发 生 。 

频繁 地 进行 范围 检查 会 影响 效率 ， 但 至 少 应 该 让 我 们 在 编译 的 时 候 可 
以 使 用 一 个 选项 ， 以 便 要 求 编译 器 在 调试 模式 下 编译 程序 的 时 候 ， 帮 我 们 
实施 数组 下 标 范围 的 检查 。 有 这 样 的 想法 的 人 ， 不 只 是 我 一 个 吧 。 

但 是 ， 请 稍微 再 想 一 想 这 个 问题 。 

可 以 使 用 int a[10]; 这 样 的 方式 声明 数组 ， 并 且 通 过 a[i] 的 方式 引 
用 数组 元 素 的 那些 编程 语言 ， 可 以 比较 容易 地 进行 数组 长 度 范 围 检 查 。 但 
是 对 于 C， 当 数组 出 现在 表达 式 中 的 时 候 ， 它 会 立刻 被 解读 成 指针 。 此 外 ， 
使 用 其 他 的 指针 变量 也 可 以 指向 数组 的 任意 元 素 ， 并 且 这 个 指针 可 以 随意 
进行 加 减 运算 。 

引用 数组 元 素 的 时 候 , 虽然 你 可 以 写成 a[i] ,但 是 它 只 不 过 是 *(a+ i) 
的 语法 糖 。 
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还 有 ， 当 你 向 一 个 函数 传递 数组 的 时 候 ， 实 际 上 你 传递 的 是 一 个 指向 
初始 元 素 的 指针 。 如 果 这 个 函数 还 存在 于 其 他 的 代码 文件 中 ( 另外 一 个 纺 
译 单元 )， 那 么 通过 编译 器 是 不 可 能 追踪 到 数组 的 。 

要 求 这 样 的 语言 在 编译 时 生成 检查 数组 长 度 的 代码 ， 是 不 是 有 些 强人 
所 难 ? 

如 果 无 论 如 何 都 需要 进行 数组 长 度 检 查 ， 可 以 考虑 将 指针 封装 成 结构 
体 那样 ， 运 行 时 让 指针 自身 持 有 可 取 值 范围 的 信息 。 可 是 这 么 做 对 性 能 的 
影响 很 大 ， 同 时 ， 也 夷 失 了 非 调试 模式 下 编译 后 的 库 和 指针 的 兼容 性 。 

总 的 来 说 ， 除 了 某 些 解释 型 的 编程 语言 之 外 ， 目 前 几乎 没有 编译 器 可 
以 为 我 们 做 数组 的 越界 检查 。 


AA 


入 四 
章 
做 个 实验 见 分 晓 一 C 是 怎么 使 用 内 存 的 


2.1 虚拟 地 址 


关于 “地 址 ”的 概念 ， 我 们 在 第 1 章 已 经 做 了 如 下 说 明 : 


变量 总 是 保存 在 内 存 的 “ 某 个 地 方 "。“ 某 个 地 方 ” 这 样 的 说 法 
不 容易 理解 ， 因 此 ， 就 像 使 用 “门牌 号 ”确定 “住址 ”一 样 ， 在 内 
存 中 ， 我 们 给 变量 分 配 “ 门 牌号 ”。 在 C 的 内 存世 界 里 ,“ 门 牌号 ” 
被 称 为 “地 址 ”。 


经 过 以 上 的 说 明 ， 有 人 可 能 会 有 这 样 的 想法 : 


哦 ， 原 来 是 这 样子 的 ! 做 的 机 器 是 128MB 的 内 存 , 这 128MB 
的 内 存 是 以 字 节 为 单位 从 0 开始 分 配 了 连续 的 编号 呀 。 也 就 是 说 ,如 
果 在 俺 的 机 器 里 用 十 进 制 来 粗略 地 计数 ， 从 0 开始 有 大 约 128 000 000 
个 地 址 吧 "。 那么 使 用 printf() 打 印 指针 的 值 , 其 结果 究 竞 是 什么 样 # 准确 地 说 ,应 该 是 128 
的 呢 ? X1024 X1024, 结果 是 
134 217 728。 




















但 是 ， 如 今 的 计算 机 可 不 是 那么 简单 的 哦 。 


现在 的 PC 机 和 工作 站 的 操作 系统 大 多 都 提供 了 多 任务 环境 , 可 以 同时 运 
行 多 个 应 用 程序 〈 进程 )。 那么， 假设 同 时 运行 两 个 应 用 程序 ， 然 后 尝试 打印 
各 自 的 变量 地 址 ， 会 出 现 一 致 的 结果 吗 ? 者 遵循 刚才 的 推论 ， 不 会 。 


好 吧 , 我 们 一 起 做 个 实验 。 首 先 , 请 将 代码 清单 2-1 编译 成 可 执行 的 文件 。 
这 里 可 执行 文件 的 名 称 为 vmtest。 
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代码 清单 2-1 vmtest.c 








1: #include <stdio.h> 

2 

3: int main(void) 

4: { 

Ds int hoge; 

6: char buf[256]; 

你 

8 : printf("&hoge...%p\n", &hoge); 
9: 
10: printf("Input initial value.\n"); 
11: fgets(buf, sizeof(buf), stdin); 
12: sscanf(buf, "%d", &hoge); 
13 : 
14 : fOr Ci) 4 
5:: printf("hoge..%d\n", hoge); 
16 : /* 
17: * getchar() 让 控制 台 处 于 等 待 输入 的 状态 . 
18: * 每 次 项 入 回 车 键 ， 增加 hoge 的 值 
19 : */ 
20 : getchar() ; 
21: hoge++; 
22 : } 
已 
24: return 0; 
25: } 








如 今 的 操作 系统 ， 大 多 提供 了 多 窗口 环境 ,请 你 在 自己 的 操作 系统 中 打 
开 两 个 新 的 窗口 。 若 习惯 用 UNIX, 请 使 用 kterm ( 或 者 类 似 的 工具 ); 若 习 惯 
用 Windows， 请 使 用 DOS 窗口 。 另 外 ， 如 果 你 没有 使 用 完全 相同 的 方式 启动 
这 些 窗 口 ， 后 面 的 实验 可 能 会 进行 得 不 太 顺 利 











单打 开 两 个 新 窗口 就 OK。 


























然后 ， 请 在 两 个 窗口 分 别 试 着 运行 刚才 的 
cd 命令 进入 程序 所 在 的 目录 )。 





在 我 的 环境 里 ， 得 到 了 如 


图 2-1 所 示 的 结果 








。Windows 的 话 ， 通 过 开始 菜 


程序 ( 如 果 有 必要 ， 可 以 通过 








人 oo 








在 第 8 行 ,通过 printfGO 输 出 变量 hoge 的 地 址 ， 然 后 通过 第 11 行 的 
fgets(), 程序 进入 了 等 待 输入 的 停止 状态 。 显 然 ,， 启动 后 的 两 个 窗口 肯定 都 
处 于 运行 状态 ,但 hoge 的 地 址 却 两 边 完全 相同 。 


这 两 个 进程 的 hoge 看 上 去 地 址 完全 相同 , 但 它们 确实 是 在 各 自 进程 里 面 
彼此 独立 无 关 的 两 个 变量 。 根据 Input initial value. 的 屏幕 窗口 提示 ， 
我 们 接着 输入 一 个 任意 值 ， 这 个 值 被 赋予 变量 hoge (第 12 行 ), 在 第 15 行 又 
被 printf() 输 出 。 随 后 ，getchar( 让 程序 处 于 等 待 输入 状态 。 每 次 敲 击 回 
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车 键 ，hoge 的 值 都 会 增长 并 且 被 输出 到 窗口 。 正 如 我 们 看 到 的 那样 ， 这 两 个 
hoge 内 存 地 址 明明 是 相同 的 ， 却 各 自 保持 着 不 同 的 值 。 








> wmtest 
到 2 8&hoge , , ,0xbfbfdB2c 


洲 
| 
本 | 
浊 
名 Peak initial value, 


i[e] ktenm 


hoge, , :DOxbfbfd62c 
Input initial value, 
20 


hoge, .20 
hoge . .21 
hoge, .22 


hoge, .23 
0 























图 2-1 通过 两 个 进程 同时 表示 变量 的 地 址 





我 在 FreeBSD 3.2-RELEASE 和 Windows 98 上 运行 了 这 个 实验 , 都 得 到 了 
以 上 的 结果 ( 编译 器 是 gcc )。 


通 对 这 样 的 实验 发 现 , 在 如 今 的 运行 环境 中 , 使 用 printfQ 输 出 指针 的 
时 候 ， 打 印 输出 的 并 不 是 物理 内 存 地 址 本 身 。 


当今 的 操作 系统 都 会 给 应 用 程序 的 每 一 个 进程 分 配 独立 的 “虚拟 地 址 空 
间 ”。 这 和 C 语言 本 身 并 没有 关系 ， 而 是 操作 系统 和 CPU 协同 工作 的 结果 。 
正 是 因为 操作 系统 和 CPU 努力 地 为 每 一 个 进程 分 配 独立 的 地 址 空间 ， 所 以 就 
算 我 毛 手 毛 脚 、 糊 里 糊涂 地 制造 了 一 个 bug, 破坏 了 某 个 内 存 区 域 ， 顶 多 也 就 










































































是 让 当前 的 应 用 程序 趴 窝 ， 但 不 会 影响 其 他 进程 。 * Windows 95/98 时 代 , 经 

















当然 了 ， 真 正 去 保存 内 存 数据 的 还 是 物理 内 存 。 操 作 系 统 负责 将 物理 内 
存 分 配给 虚拟 地 址 空间 ， 同 时 还 会 对 每 一 个 内 存 区 域 设 定 “ 只 读 ” 或 者 “可 


,七 4 A 后 
读 写 ”等 属性 。 














常 出 现 由 于 应 用 程序 
的 异常 导致 操作 系统 
瘫痪 的 情况 …… 想 不 
到 操作 系统 也 会 有 这 
样 的 硬 伤 ， 唉 。 
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* 现在 ,将 程序 的 一 部 分 
以 共享 库 的 形式 来 共 
享 使 用 ,已 经 是 很 普遍 
的 设计 手法 了 。 在 写 入 
之 前 , 连 内 存 数据 也 可 








通常 ， 因 为 程序 的 执行 代码 是 只 读 的 ， 所 以 有 时 候 会 和 其 他 进程 共享 物 
理 内 存 -。 另 外 ， 当 我 们 启动 了 几 个 笨重 的 应 用 程序 而 使 内 存 出 现 不 足 时 ， 操 
作 系 统 把 物理 内 存 中 还 没有 被 引用 的 部 分 倒 腾 出 来 ， 保 存 到 硬盘 上 。 当 程序 
再 次 需要 引用 这 个 区 域 的 数据 的 时 候 ， 再 从 磁盘 写 回 到 内 存 (恐怕 会 把 别 的 
部 分 从 磁盘 里 面 取出 来 也 说 不 定 哦 ) 这 个 操作 完全 是 在 操作 系统 的 后 台 进行 
的 ， 对 于 应 用 程序 来 说 ， 压 根 儿 不 知道 背后 发 生 的 事 。 这 时 硬盘 “ 味 只 味 喻 ” 
啊 ， 机 顺 的 反应 也 慢 了 下 来 。 


之 所 以 能 够 这 样 ， 多 亏 了 虚拟 地 址 。 正 是 因为 避免 了 让 应 用 程序 直接 面 
对 物理 内 存 的 地 址 ， 操 作 系 统 才能 够 顺利 地 对 内 存 区 域 进 行 重新 配置 ( 参照 
977) 


某 线程 的 虚 其 他 线程 的 
拟 地 址 空间 物理 内 存 虚拟 地 址 空间 


2 De 果 是 禁止 写 入 
< | _--- 如 果 是 禁止 写 
rx 台 E 旦 
的 区 域 ， 可 能 是 
| | 被 共享 了 
村 el 维基 
To Bd 
a 7 
~ -- 
过 ， 
Sa 
Sa D2 
Re ma 
x 区 
Re 人 
7 
7 
7 
’ 
吕 
bE 
p 
区 pa 
人 
Be je 
对 2 
a ~ 
ee _ ne 
- 要 Si 
| 局 Se 
人 Se 
\ Se 
、 => 
\ 
、 
、 
\ EE: 
、 ~ 
~、 
网 Se 
、 
R 
、 、 
、 、 
\ 、 
、 、 
RS i 
、 、、 
人 
、 3 
~ 
、 
\ 
四 
、 
、 
、 
J 
、 
\ 
-3 













































































一 旦 内 存 不 足 ， 就 交换 到 硬盘 
图 2-2 虚拟 内 存 的 概念 图 


要 点 
在 如 今 的 运行 环境 中 ， 应 用 程序 面 对 的 是 虚拟 地 址 空间 。 


邮 


2.1 虚拟 地 址 


55 





他 
Ty 充 关于 scanf() 


代码 清单 2-1 中 ， 使 用 下 面 的 两 条 语句 让 用 户 输入 整数 值 : 


fgets(buf, sizeof(buf), stdin); 
sscanf (buf, "%d", &hoge); 


在 一 般 的 C 入 门 书 籍 中 ， 却 经 常 看 到 以 下 写法 : 
scanf("%d", &hoge); 


在 这 一 次 的 例子 中 如 果 使 用 这 种 写法 ， 程 序 是 不 会 如 愿 运行 起 来 的 。 因 
为 这 种 写法 在 一 开始 漏 掉 了 getchar() ,没有 使 程序 执行 进入 输入 等 待 状态 。 

这 个 问题 是 由 scanf() 的 自身 实现 造成 的 。 

scanf() 不 是 以 行 单位 对 输入 内 容 进行 解释 , 而 是 对 连续 字符 流 进行 解 
释 (换行 字符 也 视 为 一 个 字符 )。 

scanf() 连 续 地 从 流 读 入 字符 ， 并且 对 和 格式 说 明 符 (%d ) 相 匹配 的 部 
分 进行 变换 处 理 。 

例如 ， 当 格式 说 明 符 为 %d 的 时 候 ， 输 入 





123ld 











从 流 中 取得 123 部 分 的 内 容 ， 并 对 它 进行 处 理 。 换 行 符 依旧 会 残留 在 流 中 。 
因此 ， 后 续 的 getchar() 会 吞食 这 个 留 下 的 换行 符 。 

此 外 ， 当 scanf() 变 换 失败 的 时 候 ( 比如 ， 尽 管 你 指定 了 %d， 但 是 输 
入 的 却 是 英文 字符 )，scanf() 会 将 导致 失败 的 部 分 遗留 在 流 中 。 

在 读 入 过 程 中 有 几 个 对 象 被 成 功 地 变换 , 则 scanf() 的 返回 值 就 为 几 。 
如 果 做 一 下 错误 检查 ， 可 能 有 人 会 写 出 下 面 的 代码 : 


while (scanf("%d", &hoge) != 1) { 
printf(" 输 入 错误 ， 请 再 次 输入 ! ") ; 
} 


分 析 一 下 上 面 的 代码 ， 我 们 就 会 知道 ， 一 旦 用 户 错误 输入 过 一 次 ， 这 
段 程序 就 会 进入 无 限 循 环 。 原 因 就 是 : 错误 输入 的 那 部 分 字符 串 ， 将 会 被 
下 一 个 scanf() 读 到 。 

像 代 码 清单 2-1 那样 ， 如 果 将 fgets() 和 sscanf() 组 合 使 用 ,就 可 以 
避免 这 个 问题 。 
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当然 , 一 旦 对 fgets 0) 函数 的 第 2 个 参数 赋予 超过 指定 长 度 的 字符 串 ， 
也 是 会 出 问题 的 。 不 过 ， 如果 像 代码 清单 2-1 这 样 指 定 了 256 个 字符 ， 对 于 
自己 使 用 的 程序 来 说 应 该 是 足够 了 。 

顺便 说 一 下 ， 在 scanf() 中 通过 指定 复杂 的 格式 说 明 符 ， 同 样 可 以 避 
免 问题 的 发 生 。 但 我 还 是 感觉 不 如 使 用 fgets() 这 种 方式 来 得 便利 。 

此 外 , 为 了 解决 这 个 问题 , 有 人 会 使 用 fflush(stdin);, 其 实 这 是 个 
着 误 的 处 理 方 法 。 

fflushQ 〇 是 对 输出 流 使 用 的 ， 它 不 能 用 于 输入 流 。 标 准 中 并 没有 定义 
用 于 输入 流 的 fflush() 的 行为 。 


2.2 “C 的 内 存 的 使 用 方法 
2.2.1 C 的 变量 的 种 类 


































































































* 在 标准 中 ,“ 作 用 域 " C 语 言 的 变量 具有 区 间 性 的 作用 域 '。 
Ce 是 信 习 二 在 开发 一 些小 程序 的 时 候 ， 也 许 我 们 并 不 在 意 作用 域 的 必要 性 。 可 是 ， 当 
的 ， 用 语 各 块 包围 的 ”你 书写 几 万 行 ， 甚 至 几 十 万 行 的 代码 的 时 候 ， 没 有 作用 域 肯定 是 不 能 忍受 的 。 
ee C 语言 有 如 下 三 种 作用 域 。 
extern 分 别 控制 静态 
连接 和 外 部 连接 。 @ 全 局 变量 
对 于 全 局 变量 ,作用 域 
指 文件 作用 域 ,链接 指 在 函数 之 外 声明 的 变量 ， 默 认 地 会 成 为 全 局 变量 。 全 局 变量 在 任何 地 方 都 
外 部 链接 。 是 可 见 的 。 当 程序 被 分 割 为 多 个 源 代码 文件 进行 编译 时 ， 声 明 为 全 局 变量 的 变 
对 于 程序 员 来 说 ,这 些 。 量 也 是 可 以 从 其 他 源 代码 文件 中 引用 的 。 





方式 都 是 控制 命名 空 











间 的 ,它们 没有 什么 不 @ 文件 内 部 的 静态 变量 
同 。 在 本 书 中 ,我 们 统 。 就 算 对 于 像 全 局 变量 那样 被 定义 在 函数 外 面 的 变量 ,一 旦 添加 了 static， 

















一 使 用 “作用 域 ”这 种 
叫 法 。 








作用 域 就 只 限定 在 当前 所 在 的 源 代码 文件 中 。 通过 static 指定 的 变量 ( 包括 
函数 )， 对 于 其 他 源 代码 文件 是 不 可 见 的 。 在 英语 中 ，static 是 “静态 的 ” 
的 意思 ， 我 实在 想 不 明日 为 什么 这 个 功能 英名 其 妙 地 被 冠 以 “static”， 这 一 点 
可 以 算是 C 语 言 的 一 个 未 解 之 迹 。 






























































@ 局 部 变量 


局 部 变量 是 指 在 函数 中 声明 的 变量 。 局 部 变量 只 能 在 包含 它 的 声明 的 语 
句 块 (使 用 得 括 起 来 的 范围 ) 中 被 引用 。 
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局 部 变量 通常 在 函数 的 开头 部 分 进行 声明 ， 但 也 可 以 在 函数 内 部 某 语 名 
块 的 开头 进行 声明 。 例 如 ， 在 “交换 两 个 变量 的 内 容 时 ， 需 要 使 用 一 下 临时 
变量 ”的 情况 下 ， 将 局 部 变量 声明 放 在 当前 语句 块 开头 还 是 比较 方便 的 。 


局 部 变量 通常 在 它 所 在 的 语句 块 结束 的 时 候 被 释放 。 如 果 你 不 想 释 放 某 
个 局 部 变量 , 可 以 在 局 部 变量 上 加 上 static 进行 声明 ( 在 后 面 有 详细 说 明 )。 










































































另外 ， 除 了 作用 域 不 同 ，C 的 变量 之 间 还 有 存储 期 ( storage duration ) 的 
差别 。 

@ 静态 存储 期 (static storage duration ) 

全 局 变量 、 文 件 内 的 static 变量 、 指 定 static 的 局 部 变量 都 持 有 静态 
存储 期 。 这 些 变量 被 统称 为 静态 变量 。 

持 有 静态 存储 期 的 变量 的 寿命 从 程序 运行 时 开始 ， 到 程序 关闭 时 结束 。 
换 名 话说， 静态 变量 一 直 存 在 于 内 存 的 同一 个 地 址 上 。 

@ 自动 存储 期 (auto storage duration ) 

没有 指定 static 的 局 部 变量 , 持 有 自动 存储 期 。 这 样 的 变量 被 称 为 自动 


= 
变量 。 
































持 有 自动 存储 期 的 变量 ， 在 程序 运行 进入 它 所 在 的 语句 块 时 被 分 配 以 内 
存 区 域 ， 该 语句 块 执行 结束 后 这 片 内 存 区 域 被 释放 。 


这 个 特征 通常 使 用 “ 栈 ” 的 机 制 来 实现 。2.5 节 中 会 对 此 做 详细 说 明 。 


接 下 来 就 不 是 “变量 ”了 。C 中 可 以 使 用 mal11oc0) 函数 动态 分 配 内 存 。 
通过 malloc 〇 动态 分 配 的 内 存 ， 寿 命 一 直 延 续 到 使 用 free0) 释 放 它 为 止 。 


在 程序 中 ， 如 果 需 要 保持 一 些 数据 ， 必 须 在 内 存 中 的 某 个 场所 取得 相应 
大 小 的 内 存 区 域 。 总 结 一 下 ,在 C 中 有 三 种 内 存 区 域 的 寿命 。 


© 静态 变量 


寿命 从 程序 运行 时 开始 ， 到 程序 关闭 时 结束 。 









































@ 自动 变量 

寿命 到 声明 该 变量 的 语句 块 被 执行 结束 为 止 。 
日 通过 malloc() 分 配 的 领域 

寿命 到 调用 freeQ 〇 为 止 。 











# 如 果 说 明 得 细致 一 些 ， 
在 几乎 所 有 的 处 理 环 
境 中 ,并 不 是 “程序 执 
行进 入 语句 块 时 ”给 自 
动 变量 分 配 内 存 区 域 ， 
而 是 在 “程序 执行 进入 
函数 时 ”统一 地 进行 内 
存 区 域 分 配 的 。 
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要 点 

C 中 有 三 种 内 存 领域 的 寿命 。 

口 静态 变量 的 寿命 从 程序 运行 时 开始 ， 到 程序 关闭 时 结束 。 
口 自动 变量 的 寿命 到 声明 该 变量 的 语句 块 执行 结束 为 止 。 
通过 malloc() 分 配 的 领域 的 寿命 到 调用 free() 为 止 。 





口 通 
名 
六 充 存储 类 型 修饰 符 
在 C 的 语法 中 ， 以 下 关键 字 被 定义 为 “存储 类 型 修饰 符 ”。 
typedef extern static auto register 


可 是 ， 在 这 些 关键 字 中 ， 真 正 是 “指定 存储 区 间 ” 的 关键 字 ， 只 有 
六 可 是 , 当 你 在 函数 的 外 static, ” 
面 使 用 static 的 时 


候 , 就 是 使 用 作用 域 来 extern 使 得 在 其 他 地 方 定义 的 外 部 变量 可 以 在 本 地 可 见 ; auto 是 默认 
控制 了 ,而 不 是 使 用 存 的， 所 以 没有 显 式 指定 的 必要 ; register 可 以 给 出 编译 器 优化 提示 ( 如 今 的 
储 期 。 编译 已 经 很 先进 了 ， 所 以 一 般 也 不 会 使 用 这 个 关键 字 ); 至 于 typedef， 它 只 


是 因为 可 以 给 编码 带 来 便利 才 被 归纳 到 存储 类 型 修饰 符 中 来 的 。 
希望 大 家 不 要 被 这 众多 的 “存储 类 型 修饰 符 ” 搞 得 手忙脚乱 。 


2.2.2 输出 地 址 


正如 之 前 所 说 , C 的 变量 中 有 几 个 阶段 的 作用 域 , 而 且 变 量 之 间 还 有 “ 存 
储 期 ”的 区 别 。 此 外 ， 通 过 mal11ocGO) 可 以 动态 分 配 内 存 。 


在 内 存 中 ， 这 些 变 量 究竟 是 怎样 配置 的 呢 ? 不 如 让 我 们 来 写 个 测试 程序 
验证 一 下 (参照 代码 清单 2-2 )。 



































代码 清单 2-2 print address.c 





#include <stdio.h> 
#include <stdlib.h> 


int global_variable; 
static int file_static_variable; 


void funcl(void) 
t 
int funcl_variable; 
static int funcl_static_variable; 








POWwWooNOUUAeAWwWN Pp 


户 记 


2.2 C 的 内 存 的 使 用 方法 
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12: printf("&funcl_variable..%p\n", &funcl_variable); 

13: printf("&funcl_static_variable..%p\n", &funcl_static_ 
variable); 

14: 了 

15: 

16: void func2(void) 

17: { 

18: int func2_variable; 

19 : 

20 : printf("&func2_variable..%p\n", &func2_variable); 

2 < 站 

22 : 

23: int main(Cvoid) 

24: { 

25: int *p; 

26: 

27: /* 输 出 指向 函数 的 指针 */ 

28: printf(C"&funcl..%p\n", funcl1); 

29 : printf("&func2. .%pNn"，func2) ; 

30 : 

31: /* 输 出 字符 囊 常 量 的 地 址 */ 

32: printf("string literal..%p\n", "abc"); 

33 : 

34: /* 输 出 全 局 变量 */ 

352 printf("&global_variable..%p\n", &global_variable); 

36 : 

37: /* 输 出 文件 内 的 Static 变量 的 地 址 */ 

38: printf("&file_static_variable..%p\n", &file_static_ 
variable); 

39 : 

40: /+* 输 出 局 部 变量 */ 

41: func1() ; 

42: func2() ; 

43 : 

44: /* 通 过 malloc 申请 的 内 存 区 域 的 地 址 */ 

45: p = malloc(sizeof(int)); 

46: printf("malloc address..%p\n", p); 

47: 

48: return 0; 

49: 了 














在 我 的 环境 中 运行 结果 如 下 : 





&funcl1. .0x8048414 

&func2. .0x8048440 

string literal..0x8048551 
&global_variable. .0x804965c 


&file_static_variable. .0x8049654 
&func1l_variable. .0xbfbfd9d8 
&funcl_static_variable. .0x8049650 
&func2_variable. .0xbfbfd9d8 
malloc address..0x805b030 
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一 开始 我 们 说 要 将 变量 的 地 址 输出 ， 代 码 清单 2-2 的 第 28 ~ 29 行 却 输出 
了 指向 函数 的 指针 。 

尽管 到 目前 为 止 没 有 提 到 过 函数 指针 的 问题 ， 但 是 这 次 的 代码 中 出 现 了 
函数 指针 。 函 数 通 过 编译 器 解释 成 机 器 码 ， 并 且 被 配置 在 内 存 的 某 个 地 方 的 
地 址 上 。 

在 C 中 , 正如 数组 在 表达 式 中 可 以 被 解读 成 指针 一 样 ,“ 函 数 ” 也 同时 意 
味 着 “指向 函数 的 指针 ”。 通 常 ， 这 个 指针 指向 函数 的 初始 地 址 。 

第 32 行 输出 使 用 "包围 的 字符 串 (字符 串 常 量 ) 的 地 址 。 

在 C 中 ,“ 字 符 串 ”是 作为 “char 的 数组 ”来 表现 的 。 字 符 串 常量 类 型 
也 是 “char 的 数组 ”, 因 为 表达 式 中 的 数组 可 以 解读 成 “指向 初始 元 素 的 指针 ?”， 
所 以 表达 式 中 的 “abc”， 同 样 也 意味 着 保存 这 个 字符 串 内 存 区 域 的 初始 地 址 。 

字符 串 常量 在 C 中 也 被 做 了 特别 对 待 ， 它 总 让 人 感觉 “不 知道 它 被 保存 
在 内 存 的 哪 一 片区 域 "， 所 以 在 这 里 我 们 也 尝试 输出 它 的 地 址 。 

第 35 行 和 第 38 行 , 分 别 输出 了 全 局 变量 的 地 址 和 文件 内 static 变量 的 
地 址 。 


















































第 41 行 和 第 42 行 ， 调 用 了 函数 func1G0 和 func2()。 第 12 行 和 第 20 
行 输出 自动 变量 的 地 址 ， 第 13 行 输出 static 局 部 变量 的 地 址 。 


再 回 到 main(0) 函数 ， 在 第 46 行 输出 利用 mal1ocGO) 分 配 的 内 存 区 域 的 
地 址 。 


接 下 来 ， 让 我 们 来 观察 一 下 实际 被 输出 的 地 址 。 
乍 一 看 ， 都 是 0x80……… 、0xbf…… 这 样 的 地 址 ， 有 点 尝 。 
将 地 址 按照 顺序 重新 排列 ， 并 且 整 理 成 表 2-1。 









































表 2-1 地 址 一 览 x 



































地 址 内 容 地 址 内 容 
0x8048414 函数 func10) 的 地 址 0x804965c ”全 局 变量 

0x8048440 ”也 数 func20) 的 地 址 0x805b030 “利用 mal1ocO 分 配 的 内 存 区 域 
0x8048551 字符 串 常量 0xbfbfd9d8 ”func1GO 中 的 自动 变量 
0x8049650 函数 内 的 static 变 量 0xbfbfd9dg ”func2() 中 的 自动 变量 


























0x8049654 ”文件 内 static 变 量 


2.3 ”函数 和 字符 串 常 


dk 
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通过 观察 ， 我 们 发 现 “指向 函数 的 指针 ”和 “字符 串 常 量 ” 被 配置 在 非 


常 近 的 内 存 区 域 。 此 外 ， 枯 数 内 static 变量 、 文 件 内 a 全 局 变 


量 等 这 些 静 态 变量 ， 也 是 被 配置 在 非常 近 的 内 存 区 域 。 








接 下 来 就 是 mall1ocO) 














分 配 的 内 存 区 域 ， 它 看 上 去 和 自动 变量 的 区 域 离 得 很 远 。 最 后 你 可 以 发 现 ， 
func1GO 和 func20) 的 自动 变量 被 分 配 了 完全 相同 的 内 存 地 址 。 









































如 果 使 用 图 来 说 明 ， 应 该 是 下 面 这 样 的 感觉 (参照 图 2-3 )。 
































static 变 量 、 
static 变 量 、 
























































图 2-3 各 种 各 样 的 地 址 








在 后 面 的 章节 中 ， 我 们 将 会 对 这 些 内 存 区 域 进行 详细 的 说 明 。 
ra = == 
2.3 ” 国 数 和 字符 串 常量 
2.3.1 只 读 内 存 区 域 
在 我 的 处 理 环境 中 ， 枯 数 (程序 自身 ) 和 字符 串 常 量 被 配置 在 内 存 里 相 





邻 的 地 址 上 。 

















这 并 不 是 偶然 的 ， 如 今 的 大 多 数 操作 系统 都 是 
汇总 配置 在 一 个 | 只 读 内 存 区 域 的 。 





将 函数 自身 和 字符 串 常 量 





出 
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x* 笔者 就 曾经 有 这 样 的 
经 历 。 在 Z80 的 情况 
下 ,只 能 通过 直接 指定 
地 址 的 方式 调用 子 程 
序 …… 当然 这 些 都 是 
老 皇 历 了 。 


大 体 上 ，Windows 、 
UNIX 等 操作 系统 就 
是 这 样 实 现 的 。 因 此 ， 
在 一 部 分 UNIX 中 ,如 
果 在 程序 运行 的 时 候 
将 该 程序 改写 ( 再 编译 
/连接 等 )， 当前 运行 的 
程序 就 会 崩溃 。 在 如 今 
的 处 理 环境 中 ,经 常会 
对 程序 加 锁 。 











于 函数 本 身 不 可 能 需要 改写 ， 所 以 它 被 配置 在 内 存 的 只 读 区 域 。 其 实 
在 很 久 以 前 ， 机 器 语言 的 程序 改写 自身 程序 代码 的 技术 是 被 大 量 使 用 的 “， 但 
是 现在 的 操作 系统 几乎 都 蔡 用 了 这 种 技术 。 


那些 能 够 修改 自身 代码 的 程序 代码 是 非常 星 涩 难 懂 的 。 此 外 ， 如 果 执 行 
程序 是 只 读 的 ， 在 同一 份 程序 被 同时 启动 多 次 的 时 候 ， 通 过 在 物理 地 址 上 共 
享 程序 能 够 节约 物理 内 存 。 此 外 ， 由 于 硬盘 上 已 经 存放 了 可 执行 程序 ， 就 算 
内 存 不 足 ， 也 不 需要 将 程序 交换 到 虚拟 内 存 ， 相 反 可 以 将 程序 直接 从 内 存 中 
销毁 。 

根据 处 理 环 境 的 不 同 ,字符 串 常 量 也 有 可 能 被 配置 在 可 改写 的 内 存 区 域 。 
像 DOS 这 样 不 实施 内 存 保护 的 操作 系统 也 就 黑 了 ， 可 是 在 UNIX 中 ， 也 有 将 
字符 串 常量 配置 在 非 只 读 内存 区 域 的 情况 。 


假设 有 下 面 这 样 一 个 函数 : 


void func(void) 































































































{ 
char *str = "abc"; 
printf("str..%s\n", str); 
省略 的 很 多 逻辑 
str[0] = 'd'; 
} 
一 且 人 允许 改写 字符 串 稼 量 ， 第 一 次 调用 郴 数 输出 “abc”， 第 二 次 调用 函数 











却 会 输出 “dbc”。 可 是 根据 代码 的 逻辑 ,给 str 赋值 “abc” 后 ， 紧 接着 就 
会 输出 str 的 值 。 尽 管 如 此 ， 第 二 次 调用 还 是 输出 了 “dbc”， 这 就 很 让 人 
头 大 。 








了 > 








2.3.2 ” 指 疝 函数 的 指针 


函数 可 以 在 表达 式 中 被 解读 成 “指向 函数 的 指针 ”， 因 此 ， 正 如 代码 清单 
2-2 的 实验 那样 ， 写 成 func 就 可 以 取得 指向 函数 的 指针 。 


“指向 函数 的 指针 ”本 质 上 也 是 指针 〈 地 址 )， 所 以 可 以 将 它 赋 给 指针 型 

















比如 有 下 面 的 函数 原型 : 


int funcCdouble d); 


03 





保存 指向 此 函数 的 指针 的 变量 的 声明 如 下 : 
int (x*func_p) (double); 
然后 写成 下 面 这 样 ， 就 可 以 通过 func_p 调用 func， 


int (x*func_p) (double); 一 一 声明 











func_p = func; 一 一 将 func 赋 给 func_p 


func_p(0.5); 一 一 此 时 ，func_p 等 同 于 func 


将 “指向 函数 的 指针 ”保存 在 变量 中 的 技术 经 常 被 运用 在 如 下 场合 : 


DGUI 中 的 按钮 控件 记忆 “ 当 自 身 被 按 下 的 时 候 需要 调用 的 函数 ” 
口 根据 “指向 函数 的 指针 的 数组 ”对 处 理 进行 分 配 


后 者 的 “指向 函数 的 指针 的 数组 ”， 像 下 面 这 样 使 用 : 


int (x*func_table[])(double) = { 
func0 ， 
func1l, 
func2 ， 
func3 ， 














.3 


func_table[i] C0.5); -调用 func_tab1le[i] 的 函数 ， 参 数 为 0.5 


使 用 上 面 的 写法 ， 不 用 写 很 长 的 switch case， 只 需 通 过 i 的 值 就 可 以 
对 处 理 进 行 分 配 。 


哦 ? 不 明白 为 什么 ? 


























确实 ， 像 
int (*func_p) (double); 一 一 指向 函数 的 指针 
还 有 ， 


int (x*func_table[]) (double); 一 一 指向 函数 的 指针 的 数组 
这 样 的 声明 ， 是 不 能 用 普通 的 方法 来 读 的 。 
关于 这 种 声明 的 解读 方式 ， 会 在 第 3 章 进 行 说 明 。 
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2.4 ”静态 变量 


2.4.1 什么 是 静态 变量 


静态 变量 是 从 程序 启动 到 运行 结束 为 止 持续 存在 的 变量 。 因 此 ， 事 态 变 
是 在 虚拟 地 址 空间 上 占有 固定 的 区 域 。 

静态 变量 中 有 全 局 变量 文件 内 static 变量 和 指定 static 的 局 部 变量 。 
因为 这 些 变量 的 有 效 作用 域 各 不 相同 ， 所 以 编译 和 连接 时 具有 不 同 的 意义 ， 
但 是 运行 的 时 候 它们 都 是 以 相似 的 方式 被 使 用 的 。 















































计 









































2.4.2 分割 编 译 和 连接 


在 C 语言 中 ,一 个 程序 可 以 由 多 个 源 代码 文件 构成 ,并且 这 些 源 代码 文 
件 在 各 自 编 译 之 后 可 以 连接 起 来 。 这 一 点 对 于 大 规模 的 编程 工作 来 说 ， 是 举 
足 轻 重 的 。 难 道 不 是 吗 ? 如 果 100 个 程序 员 一 拥 而 上 ， 一 起 的 鼓 同 一 个 源 代 
码 文件 ， 那 真是 不 可 想象 。 

此 外 ,关于 函数 和 全 局 变量 ， 如 果 它 们 的 名 称 相同 ， 即 使 它们 跨 了 多 个 
源 代码 文件 也 被 作为 相同 的 对 象 来 对 待 。 进 行 这 项 工作 的 是 一 个 被 称 为 “ 链 
接 器 ”的 程序 。 























图 2-4 链接 器 
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为 了 在 链接 器 中 将 名 称 结合 起 来 ， 各 目标 代码 大 多 都 具备 一 个 符号 表 
(symboltable ) ( 详细 内 容 需 要 依赖 实现 细节 )。 比 如 在 UNIX 中 , 可 以 使 用 nm 
这 样 的 命令 宇 视 符号 表 的 内 容 。 

不 好 意思 ， 这 里 是 UNIX 特有 的 话题 。 为 了 测试 ， 我 们 使 用 cc -c 编译 
print address.c 清单 2-2 )， 生 成 print addres.o 文件 ， 之 后 对 这 个 文 
件 使 用 nm 命令 。 在 我 的 环境 中 ， 结 果 输 出 如 下 。 















































> cc -Cc print_address.c 
> nm print_address.o 
00000004 b file_static_variable 
00000000 T | Teh 
00000000 b funcl_static_variable.4 
0000002c T func2 
00000000 tt gcc2_compiled . 
00000004 C global_variable 
00000048 T main 
U malloc 
U 


printf 











通过 观察 输出 结果 , 我 们 很 容易 发 现 符 号 表 中 记录 了 文件 内 的 static 变 
量 、 局 部 static 变量 这 些 看 上 去 不 需要 连接 的 对 象 。 


如 果 命 名 空间 不 一 样 ， 确 实 不 需要 和 其 他 文件 的 符号 连接 ， 但 是 对 于 静 
态 变量 来 说 ， 因 为 必须 要 给 它们 分 配 一 些 地 址 ， 所 以 符号 表 中 记录 了 这 些 变 
量 。 可 是 同时 我 们 也 发 现 全 局 变 量 的 剑 记 有 些 特 别 。 与 全 局 变量 使 用 C 进行 
标记 不 同 的 是 :和 外 部 没有 连接 的 符号 ,无 论 是 局 部 的 还 是 文件 内 部 的 static 
变量 ， 都 使 用 了 b 进行 标记 。 


局 部 static 变量 funcl_static_variable 的 后 面 被 追加 了 .4 这 样 的 
标记 ， 这 是 因为 在 同一 个 .o 文件 中 ， 局 部 static 变量 的 名 称 有 可 能 会 发 生 
重复 ， 所 以 在 它 后 面 追加 了 识别 标记 。 


函数 名 后 面 追加 了 工 或 者 U。 如 果 函 数 是 在 当前 文件 中 定义 的 , 就 在 其 函 
数 名 后 加 T; 如 果 函 数 定义 在 当前 文件 之 外 , 只 是 在 当前 文件 内 部 调用 此 函数 ， 































































































就 在 此 函数 后 面 加 U。 
gcc2_compiled .是 我 们 没有 见 过 的 符号 , 你 可 以 把 它 当成 处 理 环境 随意 
加 上 的 标记 ， 把 它 放 在 一 边 。 # 现在 对 共享 库 做 动态 


y ee 链接 变 成 一 件 很 自然 
链接 器 就 是 根据 这 些 信息 ， 给 这 些 到 目前 为 止 还 只 是 个 “名 称 ” 的 对 象 的 事 , 而 现实 中 可 没有 
分 配 地 址 ”。 这 么 单纯 …… 
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请 注意 自动 变量 完全 没有 出 现在 符号 表 中 。 这 是 因为 自动 变量 的 地 址 是 
在 运行 时 被 决定 的 ， 它 属于 链接 需 管 辖 范围 以 外 的 对 象 。 关 于 这 一 点 ,我们 
在 下 一 节 阐 述 。 


2.5 自动 变量 ( 栈 ) 
2.5.1 内存 区 域 的 “重复 使 用 ” 


通过 代码 清单 2-2 的 实验 ， 我 们 看 到 func1O 的 自动 变量 funcl_variable 
和 func20) 的 自动 变量 func2_variable 存在 于 完全 相同 的 地 址 上 。 


在 声明 自动 变量 的 函数 执行 结束 后 ， 自 动 变 量 就 不 能 被 使 用 了 。 因 此 ， 
func1() 执 行 结束 后 ，func2 〇 重复 使 用 相同 的 内 存 区 域 是 完全 没有 问题 的 。 


要 点 
自动 变量 重复 使 用 内 存 区 域 。 
因此 ， 自 动 变量 的 地 址 是 不 一 定 的 。 


2.5.2 ”函数 调用 究竟 发 生 了 什么 


自动 变量 在 内 存 中 究竟 是 怎样 被 保存 的 ?” 为 了 更 加 详细 地 了 解 这 一 点 ， 
还 是 让 我 们 用 下 面 这 个 测试 程序 做 一 下 实验 。 


代码 清单 2-3 auto.c 










































































1: #include <stdio.h> 

2: 

3: void func(int a, int b) 

4: { 

5 int c, d; 

6: 

7: printf(C"func:&a..%p &b..%p\n", &a, &b); 
8: printf(C"func:&c..%p &d..%p\n", &Cc, &d); 
9: 了 
10 
11: int main(Cvoid) 
12: { 
13 : int a, b; 
14: 

15 : printf(C"main:&a..%p &b..%p\n", &a, &b); 
16 : func(1, 2); 

17: 

18 : return 0; 

19: } 
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在 我 的 环境 中 运行 结果 如 下 : 





main:&a. .0xbfbfd9e4 &b. .0xbfbfd9e0 
func:&a. .0xbfbfd9d8 &b . .0xbfbfd9dc 


func:&c. .0xbfbfd9cc &d. .0xbfbfd9c8 





























如 果 把 运行 结果 用 图 来 说 明 ， 应 该 是 图 2-5 这 样 的 。 


如 果 将 main0) 的 局 部 变量 、funcGO) 的 局 部 变量 以 及 funcO 〇 的 形 参 的 地 
址 进行 比较 ，funcO) 相关 的 地 址 看 上 去 相对 小 一 些 本 


C 语言 中 ， 在 现 有 被 分 配 的 内 存 区 域 之 上 以 “堆积 ”的 方式 ， 为 新 的 函数 
调用 分 配 内 存 区 域 。 在 函数 返回 的 时 候 , 会 释放 这 部 分 内 存 区 域 供 下 一 次 函数 ”* 图 2-3 中 , 自动 变量 的 


调用 使 用 。 图 2.6 粗略 地 表现 了 这 个 过 程 。 区 域 上 方 有 一 片 广大 
的 区 域 。 在 这 片区 域 


2 中 ， 栈 不 断 地 增长 。 


func 的 局 部 变量 













































































Oxbfbfd9c8 


Oxbfbfd9cc 
func 的 局 部 变量 c 


Oxbfbfd9d0 
funcO 〇 的 


Oxbfbfd9d8 
func 的 形 参 a 


Oxbfbfd9dc 
func 的 形 参 b 
Oxbfbfd9e0 
in 的 局 部 变量 b 
的 局 部 变量 main 〇 的 
Oxbfbfd9e4 可 视 范 国 





maing 的 忆 部 变 三 





图 2-5 局 部 变量 和 参数 的 地 址 
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当然 ,最 近 的 编译 器 做 
了 各 种 优化 ,它们 不 一 
定 完全 以 这 里 描述 的 
方式 动作 。 但 是 基本 思 
想 是 一 致 的 。 


* 关于 为 什么 参数 是 从 
后 往 前 堆积 的 ,请 参照 
2.5.3 节 。 


党 








@ 初 期 状态 @ 调 用 函数 1 @ 调 用 函数 2 











@ 函 数 2 返 回 回国 数 1 返 下 @ 调 用 函数 2 
图 2-6 ”函数 调用 的 概念 图 

















对 于 像 这 样 使 用 “堆积 ”方式 的 数据 结构 ， 我 们 一 般 称 为 栈 。 
程序 员 们 有 时 候 也 使 用 数组 等 方式 实现 栈 。 但 是 ， 大 部 分 的 CPU 中 已 经 
嵌入 了 栈 的 功能 ，C 语 言 通常 直接 使 用 。 


要 点 
C 语言 中 ， 通 常 将 自动 变量 保存 在 栈 中 。 


通过 将 自动 变量 分 配 在 栈 中 ， 内 存 区 域 可 以 被 重复 利用 ， 这 样 可 以 节约 
内 存 。 

此 外 ， 将 自动 变量 分 配 在 栈 中 ， 对 于 递归 调用 (参照 25.4 节 ) 也 具有 重 
要 的 意义 。 

下 面 归纳 了 最 简约 的 C 语言 函数 调用 的 实现 : 

@ 在 调用 方 ， 参 数 从 后 往 前 按 顺序 被 堆积 在 栈 中 。 

@ 和 函数 调用 关联 的 返回 信息 〈 返 回 地 址 等 ) 也 被 堆积 在 栈 中 ( 对 应 于 
图 2-5 的 灰色 部 分 )。 所 谓 的 “返回 地 址 ”， 是 指 函数 处 理 完 毕 后 应 该 返回 的 地 
址 。 正 因为 返回 地 址 被 堆积 在 栈 中 ， 所 以 无 论 函数 从 什么 地 方 被 调用 ， 它 都 
能 返回 到 调用 点 的 下 一 个 处 理 。 
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@ 跳 转 到 作为 被 调用 对 象 的 函数 地 址 。 

@ 栈 为 当前 函数 所 使 用 的 自动 变量 增长 所 需 大 小 的 内 存 区 域 。@ 到 @ 所 
增长 的 栈 的 区 域 成 为 当前 函数 的 可 引用 区 域 。 

@ 在 函数 的 执行 过 程 中 ， 为 了 进行 复杂 的 表达 式 运 算 ， 有 时 候 会 将 计算 
过 程 中 的 值 放 在 栈 中 。 

@ 一 旦 函数 调用 结束 ， 局 部 变量 占用 的 内 存 区 域 就 被 释放 ， 并 且 使 用 返 

回信 息 返 回 到 原来 的 地 址 。 

@ 从 栈 中 除去 调用 方 的 参数 。 


2-7 展示 了 func(1，2) 被 调用 时 ， 栈 的 使 用 情况 。 它 与 图 2-5 相 吻 合 。 


2 


增长 方向 



































运算 过 程 中 的 值 等 


funcGO 的 本 地 变量 











荆 


区 funcO3l 
的 内 存 区 域 
























































] 情 况 








图 2-7 调用 func(1，2) 时 栈 的 使 














此 外 ， > 请 留意 为 形 参 分 配 新 的 内 存 区 域 。 我 们 经 常 听 说 
“C 的 参数 都 是 传 值 ， 向 函数 内 部 传递 的 是 实 参 的 副本 ”其 中 的 复制 动作 ， 其 
ee 
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* 在 某 些 环境 下 可 能 也 
能 跑 起 来 ,但 这 只 是 偶 
然 。 


* 标准 库 中 有 一 个 函数 
strtok()， 此 函数 也 
存在 类 似 的 问题 ,招致 
了 很 多 抱怨 。 


六 由 于 Java 具有 垃圾 回 
收 机 制 ， 所 以 不 需要 我 
们 显 式 地 调用 freeO)。 


补 
<3 


Ty 充 一 旦 函数 执行 结束 ， 自 动 变量 的 
内 存 区 域 就 会 被 释放 ! 


初学 者 经 常 写 出 下 面 这 样 的 程序 。 
/* 将 int 变换 成 字符 串 的 程序 #/ 


char x*int_to_str(int int_value) 


{ 
char buf[20]; 
sprintf(buf, "%d", int_value); 
return buf; 

} 


丽 怕 ……: 这 个 程序 不 能 正常 地 跑 起 来 。 

原因 估计 你 也 知道 了 : 自动 变量 buf 的 内 存 区 域 在 函数 执行 结束 后 就 
会 被 释放 。 

为 了 让 这 个 程序 先 动 起 来 ， 可 以 将 buf 声明 成 下 面 这 样 : 


static char buf[20] ; 


因为 buf 的 内 存 区 域 一 直 会 被 静态 地 保持 ， 所 以 即使 函数 执行 结束 ， 
buf 的 内 存 区 域 也 不 会 被 释放 。 

在 这 种 方式 下 ， 当 你 连续 两 次 调用 这 个 函数 ， 第 二 次 函数 调用 会 “ 悄 
悄 地 ”修改 第 一 次 函数 调用 得 到 的 字符 串 。 

strl = int_to_str(5) ; 

str2 = int_to_str(10); 


printf(《"strl..%s，str2..%s\n"，Strl，str2); 一 一 这 里 究竟 会 输出 什么 
样 的 结果 呢 ? 


程序 员 当 然 希望 输出 的 是 str1..5，str2..10。 可 惜 最 终 事与愿违 。 

这 样 的 函数 引起 了 一 个 出 乎 意料 的 bug。 此 外 ,在 多 线程 编程 的 情况 下 ， 
当前 函数 同样 也 是 有 问题 的 -。 

借助 于 malloc() 动 态 地 分 配 内 存 区 域 , 可 以 解决 上 面 的 问题 (参照 2.6 
节 )， 但 是 使 用 方 需要 同时 使 用 free() 。 


其 实 ， 作 为 最 终 的 解决 方案 ， 如 果 另 数 调用 方 事先 知道 数组 的 长 度 上 
限 ， 可 以 在 调用 方 声明 一 个 数组 ， 然 后 通过 函数 将 结果 输出 到 此 数组 中 。 
对 于 C 语 言 来 说 ， 这 是 一 个 最 实用 的 方案 。 
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补 
TY 充 一 旦 破坏 了 自动 变量 的 内 存 区 域 


假设 ， 通 过 自动 变量 声明 下 面 的 数组 : 
int hoge[10]; 


如 果 没有 做 数组 长 度 检 查 ， 将 数据 写 入 了 超过 数组 内 存 区 域 的 地 方 ， 
究竟 又 会 引发 怎样 的 悲剧 呢 ? 

如 果 只 是 超过 一 点 点 ， 可 能 也 就 是 破坏 相 邻 的 自动 变量 的 内 容 。 但 是 ， 
一 旦 将 前 方 的 内 存 区 域 径 直 地 破坏 下 去 …… 

自动 变量 是 保存 在 栈 中 的 ， 如 果 是 数组 ， 表 示 如 下 图 (参照 图 2-8 )， 


SR 


增长 方向 











其 他 的 自动 变量 

















图 2-8 栈 中 的 数组 





在 这 里 ， 如 果 大 范围 地 超过 数组 内 存 区 域 写 入 数据 ， 内 存 中 直到 存 
储 函 数 的 返回 信息 的 区 域 都 有 可 能 被 破坏 。 也 就 是 说 ， 这 个 函数 不 能 返 
回 了 。 
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# 请 参照 “黑客 不 是 骇 
客 ” 协会 ”http:/www- 
vacia.media.is.tohoku.z 
c.jp/~S-yamane/hacker 
ML/。 


当 我 们 在 追踪 一 个 bug 的 时 候 ， 发 现 函 数 处 理 已 经 走 到 了 最 后 ， 可 偏 
偏 不 能 返回 到 调用 方 。 此 时 ， 就 应 该 质疑 是 不 是 已 经 不 小 心 将 数据 写 入 了 
保存 函数 返回 地 址 的 内 存 领 域 。 

这 种 情况 下 ， 就 算是 调试 也 经 常 不 能 定位 程序 发 生 错误 的 地 方 。 因 为 
调试 也 是 使 用 堆积 在 栈 中 的 信息 ， 如 果 大 量 地 破坏 了 栈 的 内 存 领 域 ， 是 很 
难 追 踪 到 bug 发 生 的 具体 地 点 的 。 

此 外 ,由 于 越界 向 数组 类 型 的 自动 变量 写 入 数据 ,以 至 于 返回 信息 ( 返 
回 地 址 ) 被 覆盖 ， 甚 至 可 能 造成 安全 漏洞 。 

对 于 那些 没有 切实 做 好 数组 长 度 检 查 的 程序 ， 一 些 无 良 的 骇 客 会 故意 
地 传递 很 大 的 数据 , 造成 函数 的 返回 地 址 被 恶意 的 数据 所 改写 ”也 就 是 说 ， 
骇 客 完全 可 以 让 你 的 程序 去 运行 任意 的 机 器 语言 代码 。 

标准 库 中 有 一 个 gets() 函 数 , 它 和 fgets() 同 样 都 可 以 从 标准 输入 读 
取 一 行 输入 ， 但 与 fgets() 不 同 的 是 你 不 能 向 它 传 递 缓冲 的 大 小 。 因 此 ， 
gets() 是 不 可 能 做 数组 长 度 检 查 的 。 在 C 语 言 中 ， 所 谓 将 数组 作为 参数 进 
行 传递 ， 只 不 过 是 传递 指向 数组 初始 元 素 的 指针 。 作 为 被 调用 方 ， 是 完全 
不 知道 数组 究竟 有 多 长 的 。 

gets() 函 数 多 用 于 将 标准 输入 ， 也 就 是 “从 外 部 ”来 的 输入 保存 在 数 
组 中 。 因 此 ， 在 使 用 gets() 的 程序 中 ， 通 过 故意 将 包含 尺寸 很 大 的 行 的 数 
据 传递 给 gets() ， 就 可 以 达到 数组 越界 且 改 写 返 回 地 址 的 目的 。 

1988 年 名 震 互 联网 的 “互联 网 里 来 ”， 就 是 利用 了 gets() 的 这 个 弱点 。 

因为 这 些 原因 ，gets() 已 经 被 视 为 落后 于 时 代 的 函数 。 我 使 用 的 编译 
器 (gcc version 2.7.2.1 ) 在 编译 和 连接 过 程 中 ， 一 旦 发 现 当 前 代码 使 用 了 
gets() ， 就 会 提示 以 下 警告 : 


warning: this program uses gets(), which is unsafe. 


如 果 你 一 意 孤 行 还 是 要 运行 这 个 程序 ， 还 会 提示 同样 的 警告 。 

不 只 是 gets(), 还 有 比如 对 于 scanf() 这 个 函数 ,如 果 使 用 "%s" 也 会 
招致 同样 的 结果 。 但 是 ， 你 可 以 通过 对 scanf() 指 定 "%10s" 来 限制 字符 囊 
的 最 大 长 度 。 

下 面 再 给 大 家 举 一 个 有 点 恶搞 的 例子 (参照 代码 清单 2-4 )。 

并 不 是 所 有 的 运行 环境 都 是 这 样 ， 但 是 至 少 在 Windows 98 和 FreeBSD 
( 编译 器 是 gcc ) 下 ，he110() 会 被 调用 (而 且 不 止 一 次 )。 

为 什么 会 这 样 ? 请 读者 自己 思考 。 

另外 ， 这 个 程序 必然 会 以 崩溃 告终 ， 所 以 请 在 具有 内 存 保护 的 操作 系 
统 上 运行 。 
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代码 清单 2-4 stackoverflow.c 





1: #include <stdio.h> 

2 

3: void hello(void) 

人 

和 fprintf(stderr, "hel 
6: 

PAS 

8: void func(void) 

9 

10 : void *buf[10] 
ls Static nt 

2s 

让 om 0 < O00 
14: buf[i] = hello; 
5 } 

16: +} 

二 7 

18: int main(void) 

下 9 

20 : int buf[1000] ; 

2 

2 func() ; 

23E 

24: return 0; 

5 





lo!l\n"); 


i++) { 一 一 越界 ! 








2.5.3 ”可 变 长 参数 





大 部 分 的 C 语 言 人 门 书籍 往往 在 一 开始 就 频繁 地 使 朋 











月 printf(O) 这 个 输出 


文字 信息 的 函数 ， 利 用 这 个 函数 ， 可 以 将 可 变 个 数 的 参数 填充 到 字符 串 中 的 
指定 位 置 。 因 为 这 个 奇怪 的 特征 ， 在 教 初学 者 C 语言 的 时 候 ， 经 常会 有 这 样 





让 人 费解 的 说 明 : 


快 看 ， 在 C 中 的 输入 输出 并 不 是 语言 的 一 部 分 ， 而 是 作为 函数 
库 被 提供 的 。 因 此 ，printf() 这 个 函数 和 程序 员 平 时 写 的 函数 没有 


在 这 里 姑且 把 这 个 问题 先 放 一 边 。 





正如 2.5.2 节 中 说 明 的 那样 ，C 语言 的 参数 是 从 后 往 前 被 堆 


























男 外 ,在 C 语 言 中 ， 应 该 是 由 调 月 


有 方 将 参数 从 栈 中 除去 。 





积 在 栈 中 的 。 
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顺便 提 一 下 ，Pascal 和 Java 是 从 前 往 后 将 参数 堆积 在 栈 中 的 。 这 种 方式 
能 够 从 前 面 开 始 对 参数 进行 处 理 ， 所 以 对 于 程序 员 来 说 比较 直观 。 此 外 ,将 
参数 从 栈 中 除去 是 被 调用 方 应 该 承担 的 工作 。 大 部 分 情况 下 ， 这 种 方式 的 效 
率 还 是 比较 高 的 。 


为 什么 C 故意 采取 和 Pascal、Java 相反 的 处 理 方式 呢 ? 其 实 就 是 为 了 实现 









































* Pascal 和 Java 中 不 能 。” 可 变 长 参数 这 个 功能 "。" 
写 带 有 可 变 长 参数 的 
函数 。 比如 ， 对 于 像 


printf("%d, %s\n", 100, str); 
这 样 的 调用 ， 栈 的 状态 如 图 2-9 所 示 。 





增长 方向 











printfO 的 局 部 变量 

















| printf() 引 
的 区 域 


























指向 "%d, %s\n" 的 指针 





使 用 中 的 栈 














图 2-9 调用 持 有 可 变 长 参数 的 函数 











重要 的 是 ， 无 论 需要 堆积 多 少 个 参数 ， 总 能 找到 第 一 个 参数 的 地 址 。 从 
图 中 我 们 可 以 看 出 ， 从 printfQ) 的 局 部 变量 来 看 ， 第 一 个 参数 ( 指向 
"%d，%s\n" 的 指针 ) 一 定 存在 于 距离 固定 的 场所 。 如 果 从 前 往 后 堆积 参数 ， 
就 肯定 不 能 找到 第 一 个 参数 。 























QD Java 在 JDK1.5 之 后 的 版 本 也 开始 支持 可 变 长 函数 了 。 一 一 译 者 注 
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之 后 ,在 printfG 中 ， 通 过 对 找到 的 第 一 个 参数 "%d，%s\n" 进行 解析 ， 
就 可 以 知道 后 面 还 有 几 个 参数 。 


由 于 其 余 的 参数 是 连续 排列 在 第 一 个 参数 后 面 的 ， 所 以 你 可 以 顺序 地 将 
它们 取出 。 


可 是 , 现实 中 有 一 些 部 分 是 依赖 运行 环境 的 。ANSIC 为 了 提高 可 移植 性 ， 
通过 头 文件 stdarg.h 提供 了 一 组 方便 使 用 可 变 长 参数 的 宏 。 


下 面 就 让 我 们 实际 使 用 stdarg.h 写 一 个 具有 可 变 长 参数 的 函数 。 
我 们 考虑 写 一 个 山寨 版 的 printf(G) ， 取 名 为 tiny_printf()。 


tiny_printf() 的 第 一 个 参数 指定 后 续 的 各 参数 的 类 型 ， 第 二 个 参数 
开始 指定 需要 输出 的 值 。 

tiny_printf("sdd", "result..", 3, 5); 

在 这 个 例子 中 , 通过 第 一 个 参数 "sdd", 指定 后 续 的 参数 类 型 为 “字符 串 ， 
int，int”( 和 printfO 一 样 ，s 表示 字符 串 ，d 表示 数字 )。 从 第 二 个 参数 
开始 ， 分 别 向 函数 传递 字符 串 "result" 和 两 个 整数 。 


函数 执行 后 的 结果 如 下 : 



























































result.. 3 5 





和 printf() 不 同 ,因为 指定 换行 字符 的 输出 比较 繁琐 ，tiny_printfO) 
在 默认 情况 下 会 主动 进行 换行 。 


代码 如 下 (参照 代码 清单 2-5 )。 





代码 清单 2-5 tiny printf c 





1: #include <stdio.h> 

2: #include <stdarg.h> 

3: #include <assert.h> 

4: 

5: void tiny_printf(char *format, ...) 
6: { 

了 int 1; 

8: va_list ap; 

9: 
10: va_start(ap, format); 
11: for (i = 0; format[i] != '\0'; i++) { 
12: switch (format[i]) { 








13: Case 's': 


x* ANSIC 以 前 的 C 使 用 


varargs.h 这 个 头 文件 ， 
它 和 stdarg.h 在 使 用 上 
有 很 大 的 差异 。 
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14: printf("%s ", va_arg(ap, char*)); 
15 : break ; 

16 : case 'd': 

17: printf("%d ", va_arg(ap, int)); 
18 : break ; 

19 : default: 

20 : assert(0) ; 

21: } 

22: } 

23 : va_end(ap); 

24: putchar('\n'); 

25: } 

26 : 

27: int main(void) 

28: { 

29 : tiny_printf("sdd", "result..", 3, 5); 
30: 

31: return 0; 

32: 3} 














从 第 5 行 开 始 函 数 的 定义 。 对 于 形 参 声明 中 的 … 这 种 写法 , 可 能 大 家 会 感 
到 有 些 陌 生 , 但 原型 声明 也 是 写成 这 样 的 。 如 果 原 型 声明 的 参数 中 出 现 …, 对 
于 这 部 分 的 参数 是 不 会 做 类 型 检查 的 。 


在 第 8 行 , 声明 va_1ist 类 型 的 变量 ap。 stdarg.h 文件 中 定义 了 va_list 
类 型 ， 我 的 环境 中 是 这 样 定义 的 ， 

typedef char x*va_list; 

也 就 是 说 ， 在 我 的 环境 中 ，va_1ist 被 定义 成 “指向 char 的 指针 ”。 

在 第 10 行 ,va_start(ap, format); 意 味 着 “使 指针 ap 指向 参数 format 
的 下 一 个 位 置 ”。 


因此 , 我 们 得 到 了 可 变 长 部 分 的 第 一 个 参数 。 在 后 面 的 第 14 行 和 第 17 
行 ， 给 宏 va_arg( 〇 指定 ap 和 参数 类 型 ， 就 可 以 顺序 地 取出 可 变 长 部 分 的 


第 23 行 的 va_end() 只 不 过 是 个 “摆设 ”， 只 不 过 因为 在 标准 里 指出 了 对 
于 具有 va_start() 的 函数 需要 写 va_end()。 


顺便 说 一 下 ， 在 我 的 环境 中 ， 宏 va_end 0) 是 这 样 被 定义 的 : 
#define va_end(ap) 
实际 上 ，va_end(0) 就 是 个 空 定义 。 


以 上 就 是 开发 具有 可 变 长 参数 的 函数 的 方法 。 
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这 里 必须 要 注意 的 是 ， 因 为 无 论 怎 样 都 是 从 函数 内 部 顺序 地 读 出 各 参数 ， 
所 以 要 实现 可 变 长 参数 的 函数 就 必须 知道 参数 的 类 型 和 个 数 。 
printf() 将 输出 内 容 整 理 得 很 利落 ， 但 是 如 果 只 是 输出 很 少 的 内 容 ， 使 
用 printf() 就 显得 有 点 小 题 大 做 ,这 种 情况 下 ,Pascal 的 write1ln() 和 BASIC 
的 print 语句 倒是 比较 简洁 。 
如 


writeln("a..", 10, " b..", 5); 


痊 出 结果 为 : 


但 是 C 语言 是 无 法 提供 这 样 的 函数 的 。 这 是 因为 在 writeln0) 内 部 无 法 知道 
参数 的 类 型 和 个 数 。 


话说 回来 ,一 旦 学 会 了 可 变 长 函数 的 开发 方法 ， 还 是 感觉 自己 挺 了 不 起 
的 ， 无 论 如 何 总 是 想 找 个 机 会 秀一 下 。 我 就 是 这 样 的 。 


可 是 ， 对 于 可 变 长 参数 的 函数 ， 是 不 能 通过 原型 声明 来 校 验 参数 的 类 型 
的 。 另 外 ， 函 数 的 执行 需要 被 调用 方 完 全 信任 调用 方 传递 的 参数 的 正确 性 ”。 
因此 ， 对 于 使 用 了 可 变 长 参数 的 函数 ， 调 试 会 经 常 变 得 比较 麻烦 。 一 般 只 有 
在 这 种 情况 下 ， 才 推荐 使 用 可 变 长 参数 的 函数 : 如 果 不 使 用 可 变 长 参数 得 函 
数 ， 程 序 写 起 来 就 会 变 得 困难 。 

要 点 
在 决定 开发 可 变 长 参数 的 函数 之 前 ， 有 必要 讨论 是 否 真 的 需要 这 么 做 。 


补 
CG 充 assert() 






























































































































































代码 清单 2-5 中 ， 有 assert(0) ;这样 的 语句 。 
assert() 是 在 assert.h 中 定义 的 宏 ,， 使 用 方式 如 下 : 


aSssert( 条 件 表达 式 ) ; 


若 条 件 表 达 式 的 结果 为 真 ， 什 么 也 不 会 发 生 ; 若 为 假 ， 则 会 输出 相关 
信息 并 且 强 制 终止 程序 。 
我 们 经 常会 看 到 如 下 注释 : 


# 以 前 年 少 
XView 的 


无 知 ， 看 到 
函数 使 用 方 


法 ， 还 觉得 捍 帅 的 。 


# 偶尔 ， 对 于 printf， 


编译 器 有 


时 也 会 亲切 


地 给 出 “格式 定义 符 和 


实际 参数 


9 类 型 不 一 


致 ”的 警告 。 其 实 这 只 
不 过 是 编译 器 特别 照 
顾 了 printf()。 毕 况 


printfO 





是 :去 -个 被 


“ 超 " 频繁 使 用 的 函数 。 


党 
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这 个 经 常 有 。 四 


如 果 是 Java 这 样 能 够 
保证 内 存 区 域 不 会 破 
坏 ,并 且 具 备 完善 的 异 
常 处 理 机 制 的 语言 ,将 
例外 返回 反而 是 一 个 
正确 的 做 法 。 


如 果 是 在 编辑 重要 的 
数据 ,应 该 采取 紧急 安 
全 措施 。 当 然 了 , 文件 
名 称 需 要 和 普通 情况 
下 的 不 一 样 。 


“拜托 你 使 用 调试 好 
吗 ? “我 们 经 常会 听 到 
这 样 的 声音 。 实 际 上 由 
于 这 样 那样 的 原因 ,我 
们 不 能 完全 否定 
“printf() 调 试 ”这 样 
的 做 法 。 








/* 这 里 的 Str[i] 必 定 为 '\0' */ 


虽然 这 种 方式 可 以 提高 程序 的 可 读 性 , 但 也 不 是 说 你 可 以 什么 检查 也 不 做 。 
这 种 情况 下 ， 如 果 使 用 ， 


assert(str[i] == '\0'); 


可 以 帮 我 们 挑 出 bug。 

代码 清单 2-5 的 assert(0) 的 参数 为 0( 假 )， 因 此 只 要 程序 执行 经 过 
这 里 就 会 被 强制 终止 。 如 果 程 序 自身 没有 bug， 程序 是 不 会 走 到 过 程 语句 
switch 的 default 部 分 的 ， 我 认为 这 种 编程 方式 是 值得 肯定 的 。 

对 于 使 用 “强制 终止 程序 运行 ”的 方式 来 进行 异常 处 理 ， 很 多 人 是 持 
有 反对 意见 的 。 确 实 ， 对 于 用 户 的 一 些 奇 怪 的 操作 ， 比 如 传 入 一 个 奇怪 的 
文件 等 行为 ， 突 然 草率 地 终止 程序 会 让 用 户 感 到 不 知 所 措 。 

可 是 ， 如 果 不 是 由 于 这 样 的 “外 部 因素 "， 只 要 程序 自身 没有 bug 就 绝 
对 不 会 发 生 异 常 的 情况 下 ， 我 想 还 是 应 该 果断 地 终止 程序 。 使 用 “通过 返 
回 值 返回 错误 状态 ”等 宛 长 的 处 理 方 式 ， 一旦 调用 方 偷懒 没 做 检查 ”， 就 会 
放 过 很 多 本 来 可 以 很 容易 就 发 现 的 bug。 

像 C 这 样 可 以 导致 内 存 区 域 破 坏 的 语言 ， 一 旦 发 现 很 明显 的 bug， 就 
表明 当前 程序 已 经 无 法 保证 正常 运行 了 。 如 果 栈 被 破坏 了 , 就 算 你 想 返 回 错 
误 状 态 ， 也 有 可 能 无 济 于 事 ， 因 为 当前 的 函数 可 能 连 return 也 完成 不 了 。 

让 我 们 在 那些 潜在 bug 还 没有 给 你 带 来 更 大 的 麻烦 之 前 ， 麻 利 地 把 它 
们 消灭 吧 !” 


名 
YN 充 


经 常 看 到 很 多 人 为 了 调试 方便 ， 使 用 printf() 输 出 变量 的 值 "。 


尝试 开发 一 个 用 于 调试 的 函数 吧 


但 如 果 直 接 使 用 printf() 或 者 fprintf() , 当 调 试 结束 后 要 删除 它们 
可 就 麻烦 了 。 

#ifdef DEBUG 

printf(...); 

#endif /x DEBUG */ 
在 有 的 书籍 中 推荐 了 上 面 的 写法 ,但 如 果 代 码 中 充斥 了 大 量 这 样 的 东西 ， 
就 会 变 得 很 难 读 懂 。 

我 们 可 能 更 需要 下 面 这 样 类 似 于 printf() 的 写法 : 


2.$ 自动 变量 ( 栈 ) 79 





debug_write("hoge..%d, piyo..%d\n", hoge, piyo); 


可 是 ， 因 为 printf() 是 持 有 可 变 长 参数 的 函数 ， 无 法 实现 通过 
debug_write() 函数 重新 调用 printf() 的 功能 。 所 以 说 ， 自 己 实 现 
printf() 还 是 有 些 难度 的 。 啊 ， 怎 么 办 呢 ? 

这 种 情况 下 ， 标 准 库 中 提供 了 vprintf() 和 vfprintf() 这 两 个 函数 。 


void debug write(char *fmt，...) 
上 


va_list ap; 
va_start(ap, fmt); 


vfprintf(Cstderr, fmt, ap); 一 一 参数 中 传递 ap 的 地 方 是 指针 


va_end(ap); 


此 外 ， 如 果 在 此 函数 中 引用 一 个 全 局 变量 ， 就 可 以 用 来 控制 是 否 输出 
调试 信息 。 但 伴随 着 debug_write() 调 用 而 导致 的 开销 是 无 法 避免 的 。 

如 果 是 宏 , 在 编译 时 是 可 以 完全 回避 这 部 分 系统 开销 的 。 但 可 惜 的 是 ， 
我 们 无 法 向 CC 的 宏 传递 可 变 长 参数 。 

在 下 面 ， 我 们 先 定义 一 个 宏 : 

#ifdef DEBUG 

#define DEBUG WRITE(arg) debug write arg 

#else 


#define DEBUG_WRITE(arg) 
#endif 


然后 使 用 如 下 技巧 : 


DEBUG_WRITE(("hoge..%d\n", hoge)); 


这 里 必须 要 加 两 重 括号 ， 这 可 是 个 难点 哟 。 

C 语言 的 常见 问题 集 《C 语言 编程 FAQ 》 外 中 介绍 了 ,在 非 调 试 模式 时 
将 DEBUG_WRITE 定义 为 (void) 的 技巧 (p.151) 。 

通过 这 个 技巧 ， 上 面 的 语句 会 展开 成 (void)( "hoge. .%d\n"，hoge) 
的 形式 ， 它 意味 着 “将 过 号 运算 符 连接 的 表达 式 强 制 转型 成 void”。 优秀 
的 编译 器 会 通过 优化 完全 忽略 这 条 语句。 

随便 提 一 下 ， 在 ISO C99 中 的 宏 已 经 可 以 取得 可 变 长 参数 。 不 过 好 像 
几乎 都 不 是 专门 用 于 调试 的 。 

或 者 ,对 于 比较 简单 的 输出 , 如果 事先 定义 这 样 一 个 针对 int、 double、 
charx* 的 宏 ， 可 以 使 后 面 的 开发 变 得 简便 一 些 。 

#define SNAP_INT(arg) fprintf(stderr, #arg "...%d\n", arg) 


* 非常 遗憾 ,《C 语言 纺 
程 FAQ》 的 日 语 版 ( 英 
文 版 名 为 Cprogramming 
FAQS )， 已 经 绝版 了 。 
(第 8 次 印刷 注 : 由 新 纪 
元 出 版 社 重新 出 版 。 
ISBN: 4775302507 ) 
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# 依照 标准 ，stderr 是 
不 进行 缓冲 的 。 


* 实际 上 ,利用 像 本 书 中 
举 的 这 么 简单 的 程序 
来 应 对 特殊 的 案例 , 似 
平 显 得 过 于 幼 稚 。 尽 管 
如 此 ,几乎 在 所 有 的 情 
况 下 ,处 理 速 度 还 是 比 
冒 泡 算 法 等 要 快 很 多 。 


这 个 宏 可 以 像 下 面 这 样 使 用 ( 如 果 有 兴趣 知道 原理 ， 你 可 以 调查 一 下 


预 处 理 器 手册 ): 
SNAP_INT(hoge); 
输出 结果 为 : 


hoge...5 


此 外 还 有 一 点 需要 补充 。 使 用 printf() 输 出 调试 信息 ， 由 于 输出 被 组 
冲 ， 所 以 在 程序 异常 结束 的 时 候 会 发 生 关 键 信息 没有 被 输出 的 情况 。 通 过 
fprintf() 将 调试 信息 输出 到 stderr 或 者 文件 时 "， 建 议事 先 使 用 


setbuf() 停 止 缓冲 。 


2.5.4 ”递归 调用 











C 语言 通常 在 栈 中 分 配 自动 变量 的 内 存 区 域 . 这 除了 可 以 重复 使 用 该 区 域 


来 节省 内 存 以 外 ， 还 可 以 实现 递归 调用 。 
递归 调用 就 是 函数 对 自身 的 调用 。 
可 是 很 多 程序 员 对 递归 都 感到 比较 纠结 。 























纠结 的 原因 ， 除 了 递归 调用 本 身 的 难度 之 外 ， 也 有 “不 明白 究竟 有 什么 





作用 ”这 一 点 。 























世间 的 C 语言 人 门 书籍 也 经 常用 阶乘 运算 等 作为 递归 调用 的 例题 ， 我 觉 


得 这 是 有 点 不 太 合 适 的 。 为 什么 呢 ? 阶乘 什么 的 ， 用 循环 来 写 不 是 更 简单 易 


懂 吗 ? 





关于 现实 中 递归 调用 的 使 用 ， 就 拿 我 来 说 ,遍历 树 结构 、 图 形 结构 中 各 元 





素 的 情况 是 占 绝 大 多 数 的 ,但 由 于 篇 幅 的 限制 ， 就 不 月 


这些 应 月 








日 作为 例子 了 。 








这 里 举 一 个 “如 果 不 用 递归 调用 ， 程 序 就 不 太 好 写 ” 的 例子 : 快速 排序 。 


所 谓 排序 ， 就 是 将 很 多 数据 以 一 定 的 顺序 〈 比如 从 小 到 大 等 ) 进行 排列 。 
作为 排序 的 手法 ， 冒 泡 算法 、 插 入 算法 、 堆 排序 等 很 多 方法 都 为 大 家 所 知 。 























顾名思义 ， 快 速 排序 是 其 中 最 快速 的 排序 算法 。 
快速 排序 的 基本 思路 如 下 : 


@ 从 需要 排序 的 数据 中 ， 找 到 一 个 适当 的 基准 值 (pivot )。 
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@ 将 需要 排序 的 数据 按照 小 于 pivot 和 大 于 pivot 进行 分 类 。 
@ 对 分 类 后 的 两 类 数据 各 自 再 次 进行 上 述 的 @ 和 @ 的 处 理 。 


如 果 排 列 对 象 是 数组 ， 上 面 的 第 2 个 步 又 就 点 麻烦 。 下 面 是 在 不 使 用 大 
的 临时 内 存 区 域 的 情况 下 ， 对 数组 进行 分 类 的 思路 〈 假设 是 升序 排序 ): 


@ 从 左 向 右 ， 检索 比 pivot 大 的 数据 。 
@ 从 右 向 左 ， 检 索 比 pivot 小 的 数据 。 
@ 如 果 两 个 方向 都 能 检索 到 数据 ， 将 找到 的 数据 交换 。 
@ 重复 进行 @ ~ @ 的 操作 ， 直 到 从 左 开始 检索 的 下 标 和 从 右 开 始 检 索 的 下 
标 发 生 冲 突 为 止 。 
可 能 有 人 会 对 这 种 算法 的 敏捷 性 表示 怀疑 ， 但 是 这 种 算法 的 确 很 高 效 。 
在 我 的 运行 环境 中 , 测试 对 5 万 个 随机 整数 进行 排序 ， 冒 泡 算法 排序 花 了 117 
秒 ， 快 速 排序 算法 用 了 65 毫秒 就 完成 了 工作 (1 上 毫秒 = 千 分 之 一 秒 )。 
要 点 
根据 算法 不 同 ， 程 序 的 处 理 速 度 会 有 天 壤 之 别 。 所 以 ， 选 择 合适 的 算法 是 
非常 重要 的 。 























代码 清单 2-6 是 实现 快速 排序 的 源 代码 。 
代码 清单 2-6 ”快速 排序 的 程序 














1: #define SWAP(a, b) {int temp; temp = a; a= b; b = temp;} 
2 

3: void quick_sort_sub(int *data，int left, int right) 

4: 工 

5S:: int left_index = left; 

6: int right_index = right; 

了 int pivot = data[(left + right) / 2]; 

8: 

9: while (left_index <= right_index) { 
10: for ( ; data[left_index] < pivot; left_index++) 
11: ; 
12: for ( ; data[right_index] > pivot; right_index--) 
13: ; 
14: 
D3 if (left_index <= right_index) { 
16: SwAP(data[left_index], data[right_index]); 
17: left_index++; 
18: right_index--; 
19: } 
20: } 
21: 
2 if (right_index > left) { 
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# 尽管 这 里 的 算法 占 了 
整 篇 代码 的 一 大 半 , 但 
为 了 不 跑题 ， 笔 者 对 
算法 不 进行 详细 的 说 
明 ,还 是 请 读者 自己 去 





2.32 quick_sort_sub(data, left, right_index); 
24: } 

25 : if (left_index < right) { 

26: quick_sort_sub(data, left_index, right); 
2:7:3 

28: } 

29 : 

30: void quick_sort(int *data, int data_size) 

31: { 

32: quick_sort_sub(data, 0, data_size - 1); 

33: } 











这 个 例 程 是 对 int 的 数组 进行 排序 。 
向 函数 quick_sortQ 〇 传递 int 型 数组 data 和 数组 的 长 度 , 数组 中 的 元 
素 会 被 升序 排序 。 


quick_sort_sub( 将 数组 data 的 元 素 从 data[1left] 到 data[right] 
的 部 分 进行 排序 (包括 data[1eft] 和 data[right] )。 


quick_sort_sub() 首 先决 定 pivot 的 值 ， 然 后 把 数组 的 元 素 分 成 大 于 
pivot 和 小 于 pivot 两 个 类 别 。 
然后 ， 对 于 分 类 后 还 存在 两 个 以 上 元 素 的 数组 ， 递 归 地 调用 自身 (第 23 
行 和 第 26 行 )。 
因为 程序 优先 对 数组 的 左 侧 进 行 处 理 ， 所 以 数组 将 会 被 排序 成 图 2-10 中 
的 样子 。 


























部 分 数组 4 















































部 分 数组 3 
Ee 
部 分 数组 2 
‘re | 
部 分 数组 1 
个 9 
| 
原来 的 数组 

















图 2-10 快速 排序 的 概念 图 


2.$ 自动 变量 ( 栈 ) 


83 





首先 ， 原 始 的 数组 被 分 类 成 大 于 pivot 和 小 于 pivot 两 个 部 分 。 对 分 类 
后 的 左 侧 〈 部 分 数组 1 ) 递归 调用 自身 再 次 进行 分 类 〈@@ )。 然 后 对 分 类 的 结 
果 的 左 侧 再 分 类 ， 再 分 类 …… 就 这 样 不 断 地 递归 下 去 ， 一 直 进行 到 左 侧 还 剩 
下 一 个 元 素 ( @ )， 再 去 处 理 右 侧 。 就 这 样 顺 次 地 连续 返回 ， 对 残留 的 部 分 进 
行 处 理 ( @ )。 


那么 在 这 里 ， 处 理 完 数组 某 部 分 的 左 侧 之 后 ， 之 所 以 处 理 还 能 够 转移 到 
右 侧 ， 是 因为 C 将 自动 变量 分 配 在 栈 中 。 


这 个 程序 将 数组 分 成 两 部 分 之 后 ， 再 进行 递归 调用 。 此 时 ， 在 栈 中 分 配 
了 新 的 用 于 当前 部 分 数组 的 内 存 区 域 。 另 外 ， 当 某 部 分 数组 的 数据 处 理 完 毕 ， 
函数 调用 返回 的 时 候 ， 栈 会 收缩 ， 调 用 前 的 状态 恰好 处 于 栈 的 最 初 位 置 。 正 
因为 如 此 ， 处 理 才 这 样 不 断 地 向 右 移动 。 


如 果 这 个 程序 不 写成 递归 ， 程 序 写 起 来 会 变 得 有 点 麻烦 。 






















































































拒绝 偏见 ， 请 大 家 慢 慢 习 惯 去 运用 递归 。 
名 
ANSIC 以 前 的 C， 为 什么 不 能 
初始 化 自动 变量 的 聚合 类 型 ? 


ANSI C 以 前 的 C， 只 有 标量 才能 在 声明 的 同时 被 初始 化 (参照 1.1.8 
第 庆 
因此 ， 在 如 今 能 这 样 写 的 代码 ; 


void func(void) 


int array[] = {1, 2, 3, 4, 5}; 


曾经 只 能 写成 下 面 这 样 ; 
void func(void) 


static int array[] = {1, 2, 3, 4, 5}; 


就 像 现在 看 到 的 这 样 ， 局 部 变量 的 内 存 区 域 是 在 函数 被 调用 时 ， 也 就 
是 在 执行 中 被 分 配 的 。 在 执行 中 ， 如 果 想 要 初始 化 数组 等 聚合 类 型 ， 编 译 
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器 必须 在 现场 生成 一 些 代码 ， 编 译 器 就 被 复杂 化 。 你 应 该 还 记得 前 面 提 到 
过 “原本 C 是 只 能 使 用 标量 的 语言 吧 。 

对 于 这 这 种 情况 , 如 果 加 上 static 作为 静态 变量 分 配 内 存 区 域 , 就 可 
以 在 程序 的 执行 前 被 完全 初始 化 。 

从 ANSI C 开始 ， 聚 合 类 型 的 自动 变量 也 可 以 在 声明 的 时 候 进行 初始 
化 。 可 是 ， 尽 管 这 样 还 是 会 花费 相应 的 成 本 ,在 可 以 使 用 静态 数组 的 情况 
下 ,如 果 添 加 static 可 以 获得 令 人 满意 的 运行 效率 ,如 果 同 时 加 上 const， 


效率 可 能 会 更 好 。 
此 外 ， 就 算是 ANSIC， 在 聚合 类 型 的 初始 化 运算 符 中 也 只 能 写 常量 。 
比如 ， 


void func(double angle) 


double hoge = sin(angle); 


这 样 写 是 没有 问题 的 ， 但 


void func(double angle) 
{ 
double hoge[] = {sin(angle), cos(angle)}; 


这 么 写 就 违反 语法 规范 了 。 
Rationale 的 3.5.7 中 说 明了 理由 ,下 面 的 代码 似乎 会 引起 理解 上 的 混乱 ， 
int x[2] = { f(x[1]), g(x[0]) }; 


由 于 聚合 类 型 的 初始 化 运算 符 中 只 能 写 常量 ， 所 以 编译 器 的 处 理会 变 
得 简单 一 些 。 因 为 只 要 事先 在 某 个 地 方 分 配 一 个 填充 初始 值 的 内 存 区 域 ， 
然后 在 进入 程序 块 的 时 候 复制 这 个 区 域 就 可 以 了 。 


2.6 利用 malloc() 来 进行 动态 内 存 分 配 ( 堆 ) 
2.6.1 malloc() 的 基础 


C 语 言 中 可 以 使 用 mal1ocG) 进 行动 态 内 存 分 配 。 


mal1ocGO) 根 据 参 数 指定 的 尺寸 来 分 配 内 存 块 ， 它 返回 指向 内 存 块 初始 位 
置 的 指针 ， 经 常 被 用 于 动态 分 配 结构 体 的 内 存 领域 、 分 配 执行 前 还 不 知道 大 
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小 的 数组 的 内 存 领 域 等 。 
p = malloc(size); 


一 旦 内 存 分 配 失败 ( 内存 不 足 ), mal11ocO 〇 将 返回 NULL。 利用 mallocO 〇 分 配 
的 内 存 被 结束 使 用 的 时 候 ， 通 过 free 〇 来 释放 内 存 。 




















free(p); ”一 一 释放 p 指向 的 内 存 区 域 
以 上 是 mallocQ 〇 的 基本 使 用 方式 。 
像 这 样 能 够 动态 地 ( 运行 时 ) 进行 内 存 分 配 ， 并 且 可 以 通过 任意 的 顺序 x 
释放 的 记忆 区 域 ， 称 为 堆 (heap ) "。 人 
英语 中 “heap” 这 个 单词 是 指 像 山 一 样 堆 得 高 高 的 事物 〈 比如 干草 等 ) 
mallocO 就 好 像 从 内 存 的 山上 分 出 一 部 分 内 存 ， 为 我 们 “从 堆 中 取 来 所 需 的 
内 存 区 域 ”。 
mallocO) 主 要 有 以 下 的 使 用 范例 ; 
@ 动态 分 配 结构 体 


藏书 家 可 能 会 用 计算 机 管理 自己 的 藏书 。 刚 从 书店 买 回来 一 本 书 ， 却 发 
现 :“ 啊 ! 原来 这 本 书 我 已 经 有 了 ! ”特别 是 漫画 书 ， 经 常会 有 重复 购买 的 现 
象 ， 有 吧 ? (难道 只 有 我 是 这 样 ? ) 

因此 ， 最 好 做 一 个 “藏书 管理 程序 "。 

假设 用 下 面 这 样 的 结构 体 管理 一 本 书 的 数据 : 

typedef struct { 

char title[64]; /x* 书 名 */ 


int price; /* 价 格 */ 
char isbn[32] ; /*ISBN*/ 



















































































} ee 
对 于 藏书 家 来 说 ， 他 一 定 要 管理 堆积 如 山 的 BookData。 
在 这 种 情况 下 ， 当 然 可 以 通过 一 个 巨大 的 数组 来 管理 大 量 的 BookData， 
但 是 在 C 中 必须 明确 定义 数组 的 长 度 ， 究 竞 需 要 定义 多 大 的 数组 是 一 件 让 人 
头疼 的 事情 。 如 果 申 请 过 大 的 数据 空间 浪费 内 存 ， 但 如 果 申 请 的 大 小 刚刚 好 ， 
随 着 书 的 增加 ， 数 组 的 空间 又 会 变 得 不 足 。 


通过 下 面 的 方式 ， 就 可 以 在 运行 时 分 配 BookData 的 内 存 区 域 。 
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BookData *book_data_p; 


/* 分 配 一 个 结构 体 BookData 的 内 存 区 域 */ 
book_data_p = malloc(sizeof (BookData)); 


如 果 使 用 链表 来 管理 ， 就 可 以 持 有 任意 个 数 的 BookData。 当 然 ， 只 要 你 
内 存 足 够 。 


关于 链表 的 使 用 方法 ， 在 这 里 只 是 稍稍 提 一 下 ， 在 第 5 章 会 详细 说 明 。 
首先 让 我 们 向 结构 体 BookData 中 追加 一 个 指向 BookData 类 型 的 指针 
































沪 
0 


typedef struct BookData tag { 
char title[64]; /* 书 名 */ 
int price; /* 价 格 */ 
char isbn[32]; /* ISBN */ 


struct BookData_tag *next; 一 一 追加 这 一 行 
} BookData; 





在 这 个 例子 中 ,利用 typedef 为 struct BookData_tag 定义 同义词 
BookData (不 用 一 次 次 地 写 struct 了 )。 尽 管 如 此 ， 由 于 成 员 next 声明 时 
typedef 还 没有 结束 ， 所 以 请 注意 这 里 必须 要 写成 struct BookData_tag。 
tag 不 能 省 略 。 


通过 next 持 有 “指向 下 一 个 BookData 的 指针 ”， 像 图 2-11 这 样 形 成 串 
# 以 后 ， 图 中 的 e 一 表示 珠 的 数据 结构 ， 就 能 够 保存 大 量 的 BookData 。 
指针 ,区 表示 NULL。 


























BookData 
将 最 后 设 
定 为 NULL 


图 2-11 链表 
这 种 被 称 为 “链表 ”的 数据 结构 运用 非常 广泛 。 
@ 分 配 可 变 长 数组 
在 刚才 的 BookData 类 型 中 ， 书 名 的 地 方 写成 下 面 这 样 : 


char title[64]; /* 书 名 */ 
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可 是 有 的 情况 下 ， 书 名 也 很 变态 ， 比 如 ， 


京都 露天 混 浴 澡堂 蒸气 谋杀 事件 一 一 美女 大 学 生 3 人 组 所 见 ! 
谜 一 样 的 旅馆 女 主人 死亡 和 10 年 前 的 观光 客 失踪 事件 的 背后 所 
潜藏 的 真相 是 ? 


(这 还 是 书 名 吗 ? ) 


此 时 ，char title[64] 就 放 不 下 这 么 长 的 书 名 了 。 可 是 ， 也 不 是 所 有 的 
书 都 有 这 么 长 的 书 名 ， 所 以 准备 太 长 的 数组 也 是 浪费 。 


这 里 ,将 title 的 声明 写成 : 























char *title; /* 书 名 */ 
然后 ， 


BookData *book_data_p; 





/* 这 里 1en 为 标题 字符 数 +1 ( 空 字 符 部 分 的 长 度 ) */ 
book_data_p->title = malloc(sizeof(char) * len); 


就 能 够 只 给 标题 字符 串 分 配 它 必 要 的 内 存 区 域 了 。 
此 时 ， 如 果 想 要 引用 title 中 某 个 特定 的 字符 ， 当 然 可 以 写成 
book_data_p->title[i] 


大 家 想必 还 记得 p[i] 是 *Cp + 1 的 语法 糖 吧 。 











补 
“TD 充 malloc() 的 返回 值 的 类 型 为 void* 


ANSIC 以 前 的 C, 因为 没有 void* 这 样 的 类 型 , 所 以 malloc() 返 回 值 
的 类 型 就 被 简单 地 定义 成 char*x。char* 是 不 能 被 赋 给 指向 其 他 类 型 的 指针 
变量 的 ， 因 此 在 使 用 malloc() 的 时 候 ， 必 须要 像 下 面 这 样 将 返回 值 进行 强 
制 转型 ; 

book_data_p = (BookData*)malloc(sizeof(BookData)); 

ANSIC 中,，malloc() 的 返回 值 类 型 为 void*，void* 类 型 的 指针 可 以 
不 强制 转型 地 赋 给 所 有 的 指针 类 型 变量 。 因 此 ， 像 上 面 的 强制 转型 现在 已 
经 不 需要 了 。 
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x* 如 果 可 能 ,应 该 提高 警 
告 的 级 别 , 以 便 让 警告 
可 以 输出 。 


* 这 原本 是 UNIX 的 术语 。 


尽管 如 此 ， 现 在 还 有 人 时 常 在 这 里 使 用 强制 转型 。 我 认为 ， 不 写 多 余 
的 强制 转型 代码 ， 对 于 顺畅 地 读 懂 代码 是 有 利 的 。 

此 外 ， 假 设 忘记 了 #include stdlib.h， 一 旦 策 扫地 对 返回 值 进行 强制 
转型 ， 编 译 器 很 可 能 不 会 输出 警告 。 

C 语 言 默认 地 将 没有 声明 的 函数 的 返回 值 解释 成 int 类 型 ， 那 些 运气 
好 、 目 前 还 能 跑 起 来 的 程序 ， 如果 被 迁移 到 int 和 指针 长 度 不 同 的 处 理 环 
境 中 ， 就 会 突然 跑 不 动 了 。 

因此 ,我 们 不 要 对 malloc() 的 返回 值 进行 强制 转型 ,因为 C 不 是 C++。 

另外 ，C++ 中 可 以 将 任意 的 指针 赋 给 void# 类 型 的 变量 ， 但 不 可 以 将 
voidx* 类 型 的 值 赋 给 通常 的 指针 交 量 。 所 以 在 C+ 中 ，malloc() 的 返回 值 
必须 要 进行 强制 转型 。 但 是 ， 如 果 是 C++， 通 常 使 用 new 来 进行 动态 内 存 
分 配 ( 也 应 该 这 样 )。 


2.6.2 ”malloc() 是 “系统 调用 ” 吗 
这 里 有 一 点 离 题 。 


C 的 函数 库 中 为 我 们 准备 了 很 多 的 函数 (printf() 等 ) 另外, 标准 库 的 
一 部 分 函数 最 终 会 调用 “系统 调用 "。 所 谓 系统 调用 ， 就 是 请 求 操作 系统 来 帮 
我 们 做 一 些 特殊 的 函数 群 。 标 准 函 数 通 过 ANSIC 进行 了 标准 化 , 但 是 不 同 操 
作 系 统 上 的 系统 调用 的 行为 却 经 常会 有 差别 。 


比如 在 UNIX 操作 系统 中 , printf() 最 终 调用 write() 这 样 的 系统 调用 。 
不 只 是 printf()，putcharO) 和 puts 0 在 最 终 也 是 调用 write()。 


于 write() 只 能 输出 指定 的 字 节 串 ， 为 了 让 应 用 开发 人 员 更 方便 地 使 
用 和 提高 可 移植 性 ，C 语言 给 write() 披 上 了 标准 库 的 “ 皮 ”。 


话说 回来 ，mallocO 〇 是 系统 调用 ? 还 是 标准 库 函 数 ? 
可 能 很 多 人 会 认为 它 是 系统 调用 。 恰 恰 相 反 ，malloc() 实 际 上 属于 标准 
库 函 数 ， 它 不 是 系统 调用 。 
要 点 
malloc( 不 是 系统 调用 。 
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2.6.3 malloc() 中 发 生 了 什么 


mal1ocGO 大 体 的 实现 是 ， 从 操作 系统 一 次 性 地 取得 比较 大 的 内 存 ， 然 后 
将 这 些 内存 “ 零 售 ” 给 应 用 程序 。 


根据 操作 系统 的 不 同 ， 从 操作 系统 取得 内 存 的 手段 也 是 不 一 样 的 ,在 * break 的 略称 。 


UNIX 的 情况 下 使 用 brk QO 的 系统 调用 。 * 在 最 近 的 实现 中 , 有 时 
也 会 使 用 mmap() (后 
请 大 家 回想 一 下 ， 在 图 2-3 中 ,“ 利 用 malloc 分 配 的 内 存 区 域 ”的 下 面 ， 面 会 提 到 )。 使 用 


是 一 片 范 围 很 大 的 空间 。 系 统 调用 brkO 〇 就 是 通过 设 定 这 个 内 存 区 域 的 末尾 mallocQ) 分 配 小 区 
地 址 ， 来 伸缩 内 存 空间 的 函数 的 。 域 的 时 候 ， 还 是 使 用 


brk() 。 
调用 函数 的 时 候 ， 栈 会 向 地 址 较 小 的 一 方 伸 长 。 多 次 调用 mallocGO) 时 ， 
会 调用 一 次 brk()， 内 存 区 域 会 向 地 址 较 大 的 一 方 伸 长 。 






























































二 号 三 网 
生态 变量 


(函数 内 的 static 变 量 、 


文件 内 的 static 变 量 、 


全 局 变量 ) 




















malloc 分 配 的 内 存 




















通过 brk 〇 伸 长 


调用 函数 伸 长 
自动 变量 








图 2-12 ”内 存 区 域 的 伸 长 
“ 哈 ? 就 算 可 以 通过 这 种 方式 分 配 内 存 区 域 ， 但 是 做 不 到 以 任意 
的 顺序 释放 内 存 吧 ? ” 
也 许 会 有 很 多 人 存在 以 上 的 想法 。 实 际 上 ， 这 是 有 道理 的 。 


如 果 这 么 说 ， 大 家 自然 会 想 问 :“ 那 么 freeO 又 是 什么 ” ”那么 下 面 来 
说 说 malloc() 和 free() 的 基本 原理 。 
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* 这 个 操作 被 称 为 合并 
( coalescing )。 也 有 不 
实现 这 个 操作 的 ,但 这 
样 会 加 剧 碎片 化 ( 参照 
2.6.5 节 )。 


现实 中 的 malloc0O) 的 实现 ,在 改善 运行 效率 上 下 了 很 多 工夫 。 这 里 我 们 
只 考虑 最 单纯 的 实现 方式 一 一 通过 链表 实现 。 


顺便 提 一 下 ，KQ&R 中 也 记载 了 通过 链表 实现 mal1oc(0) 的 例 程 。 


最 朴素 的 实现 就 是 如 图 2-13， 在 各 个 块 之 前 加 上 一 个 管理 区 域 , 通过 管 
理 区 域 构建 一 个 链表 。 


malloc() 遍 历 链表 寻找 空 的 块 ， 如 果 发 现 尺 寸 大 小 能 够 满足 使 用 的 块 ， 
就 分 割 出 来 将 其 变 成 使 用 中 的 块 ， 并 且 向 应 用 程序 返回 紧邻 管理 区 域 的 后 面 
区 域 的 地 址 。free() 将 管理 区 域 的 标记 改写 成 “ 空 块 ", 顺便 也 将 上 下 空 的 块 
合并 成 一 个 块 。 这 样 可 以 防止 块 的 碎片 化 。 





































































































如 果 区 域 不 足 ， 请 
求 操作 系统 扩容 





图 2-13 通过 链表 实现 mal1oc() 的 例子 





如 果 不 存在 足够 大 的 空 块 ,就 请 求 操作 系统 对 空间 进行 扩容 ( UNIX 下 使 
用 brkQ 〇 系统 调用 )。 


那么 ,在 这 种 内 存 管理 方式 的 运行 环境 中 ,一 旦 数组 越界 检查 发 生 错误 ， 
越过 mal1ocO) 分 配 的 内 存 区 域 写 人 了 数据 ， 又 会 发 生 什 么 呢 ? 


此 刻 将 会 破坏 下 一 个 块 的 管理 区 域 , 所 以 从 此 以 后 的 mallocGO 和 free() 
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调用 中 出 现 程序 崩溃 的 几率 会 非常 高 。 这 种 情况 下 ， 不 能 因为 程序 是 从 
mal1ocG) 中 崩溃 的 就 一 口 咬定 “这 是 库 的 bug!11!” 这 人 么 做 只 会 自 取 其 辱 。 
现实 中 的 处 理 环境 ， 是 不 会 这 样 单纯 地 实现 mal11ocO 〇 功能 的 。 

比如 ， 作 为 内 存 管理 方法 ， 除 了 这 里 说 明 的 链表 方式 之 外 ， 还 有 一 个 被 
大 家 广泛 熟知 的 “buddy block system” 方 法 。 这 种 将 大 的 内 存 逐 步 对 半分 开 
的 方式 ， 虽然 速度 很 快 ， 但 会 造成 内 存 的 使 用 效率 低下 。 

此 外 ， 让 管理 区 域 和 传递 给 应 用 程序 的 区 域 相 邻 也 是 比较 危险 的 ， 所 以 
有 的 实现 中 会 将 它们 分 开 存 放 。 我 的 环境 (FreeBSD3.2 ) 就 是 这 样 的 〈 现行 
的 实现 中 也 有 很 多 是 相 邻 存放 的 )。 

不 过 ， 我 在 这 里 只 是 想 说 明 “ma11ocG) 绝 对 不 是 一 个 魔法 函数 ”。 

随 着 CPU 和 操作 系统 的 不 断 进化 ， 也 许 有 一 天 mal1locO 〇 会 成 为 真正 的 
魔法 函数 。 但 目前 你 肯定 不 能 将 mal1oc (看 成 魔法 函数 。 对 于 mal11ocO) 的 
工作 原理 ， 如 果 不 是 非常 了 解 ， 就 很 有 可 能 陷 人 程序 不 能 正常 进行 调试 的 窘 
境 ， 或 者 常常 写 出 非常 低 效 的 程序 。 

所 以 我 建议 大 家 先 充 分 理解 mal11ocO 〇 后 再 去 使 用 它 , 不 然 它 只 会 给 你 带 
来 危险 。 


要 点 
malloc() 绝 对 不 是 魔法 函数 。 


2.6.4 ”free() 之 后 ， 对 应 的 内 存 区 域 会 怎样 


正如 刚才 所 说 ，malloc 〇 管理 从 操作 系统 一 次 性 地 被 分 配 的 内 存 ， 然 后 
零售 给 应 用 程序 ， 这 是 它 大 致 的 实现 方式 。 


因此 ， 一 般 来 说 调用 freeO) 之后， 对 应 的 内 存 区 域 是 不 会 立刻 返还 给 
作 系统 的 。 让 我 们 通过 代码 清单 2-7 来 做 个 实验 。 
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代码 清单 2-7 free.c 





#include <stdio.h> 
#include <stdlib.h> 


int main(Cvoid) 


int x*int_p; 


DO 上 PN 请 


中 第 2 章 ”做 个 实验 见 分 晓 一 一 C 


是 怎么 使 用 内 存 的 





8: 


9: 
10 
11: 
12: 
13 : 
14 : 
15 : 
16 : 
17: 





} 


int_p = malloc(sizeof(int)); 一 一 在 利用 mal1loc() 分 配 的 
内 存 区 域 中 …… 

*int_p = 12345; 一 一 写 入 

free(int_p); 一 一 调用 free() 之 后 

printf(C"*int_p..%d\n", *int_p); 一 一 输出 对 应 的 内 容 ! 


return 0; 











在 我 的 环境 中 执行 这 个 程序 ， 会 输出 12345。 之 后 随 着 某 次 mal11ocGO) 调 
用 ， 恰 好 将 这 片区 域 重新 进行 分 配 后 ， 才 会 发 生 这 部 分 内 容 的 改写 。 


但 是 > 











C 标 准 不 能 保证 情况 总 是 这 样 。 


引用 对 应 的 内 存 区 域 的 。 
这 里 之 所 以 特地 举 出 这 个 例子 ， 是 因为 “调用 freeO 之 后 ， 对 应 的 内 存 


内 容 不 会 被 马上 破坏 ”。 这 样 的 特性 
如 图 2-14， 某 内 存 














因此 ， 调 用 free() 之 后 ， 是 不 能 





给 程序 调试 中 的 原因 查 明 带 来 了 困难 。 
区 域 被 两 个 指针 同时 引用 。 使 用 指针 A 引用 这 个 区 域 


的 程序 员 认 为 当前 区 域 对 他 来 说 已 经 不 需要 了 ， 于 是 稀里糊涂 地 调用 了 
free() 。 实 际 上 ， 在 远离 当前 这 段 代码 的 地 方 ， 指针 B 还 在 引用 当前 这 片区 
# 大 型 的 程序 常常 会 出 ” 域 。 此 时 ， 会 发 生 什么 呢 ?? 


仓促 地 调用 freeQ) 是 有 问题 的 ， 就 算 调用 了 free()， 指 针 B 引用 的 内 
存 区域 也 不 会 立刻 被 破坏 ， 暂 时 还 保持 着 以 前 的 值 。 直 到 在 某 个 地 方 执行 
malloc()， 随 着 当前 内 存 区 域 被 重新 分 配 ， 内 容 才 开始 被 破坏 。 这 样 的 bug， 
从 原因 产生 到 bug 被 发 现 之 间 周 期 比较 长 ， 因 此 给 程序 调试 带 来 很 大 困难 。 


现 这 种 问题 。 









反正 不 用 了 ， 
free() 掉 … 











区 域 











B 、|/ 




































































但 是 ， 还 有 人 在 
某 个 角落 果 着 呢 




















图 2-14 一 个 内 存 























区 域 被 








两 个 指针 引用 …… 


为 了 避免 这 个 问题 ， 如 果 是 大 型 程序 ， 可 以 做 一 个 函数 给 free() 披 一 张 
皮 ， 并 且 使 程序 员 们 只 能 调用 这 个 函数 ， 在 区 域 被 释放 之 前 故意 将 区 域 破坏 
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(可 以 胡乱 地 填充 一 个 像 0xCC 这 样 的 值 ) 可 惜 的 是 ,我 们 无 法 知道 当前 指针 
指向 的 区 域 的 大 小 "。 如 果 偏 要 这 么 做 ， 可 以 考虑 也 给 mallocGO 披 上 一 张 皮 ， 
每 次 分 配 内 存 的 时 候 可 以 多 留 出 一 点 空间 ， 然 后 在 最 前 面 的 部 分 设 定 区 域 的 
大 小 信息 。 


当然 ， 这 种 手法 只 能 用 于 程序 的 调试 版 本 。 在 去 掉 调 试 选项 对 程序 进行 
编译 的 时 候 ， 这 些 代码 就 会 消失 。 这 样 就 不 会 影响 发 行 版 的 程序 的 运行 效率 。 

这 么 做 虽然 有 点 麻烦 ,但 是 对 于 大 规模 的 程序 来 说 ， 这 种 手法 还 是 非常 
有 效 的 。 















































2.6.5 ”碎片 化 


某 些 处 理 环境 对 mal1oc 0 的 实现 ， 和 2.6.3 市 中 描述 的 没有 大 的 差别 ， 
但 是 以 随机 的 顺序 分 配 、 释 放 内 存 。 此 时 ， 又 会 发 生 什么 问题 呢 ? 


此 时 ， 内 存 被 零 零碎 碎 分 割 ， 会 出 现 很 多 细碎 的 空 块 。 并 且 ， 这 些 区 域 
事实 上 是 无 法 被 利用 的 。 


这 种 现象 ， 我 们 称 为 碎片 化 〈fragmentation ) (参照 图 2-15 )。 






































X < 一 
X < 一 
如 此 小 的 空 块 ， 
义 < 事实 上 是 无 法 
被 利用 的 。 
x < 一 
X <— 





图 2-15 碎片 化 








将 块 向 前 方 移动 ， 缩 小 块 之 间 的 距离 ， 倒 是 可 以 整合 零碎 的 区 域 并 将 它 
们 组 合成 较 大 的 块 "。 可 是 C 语 言 将 虚拟 地 址 直接 交 给 了 应 用 程序 ， 库 的 一 方 
是 不 能 随意 移动 内 存 区 域 的 。 


在 C 中 , 只 要 使 用 malloc() 的 内 存 管理 过 程 ， 就 无 法 根本 回避 碎片 化 问 
题 ,但 车 利用 rea11oc0 函数 ( 在 下 一 节 说 明 ), 倒 可 以 让 问题 得 到 一 些 改善 









































NI 


x* 如 果 使 用 mal1locO 〇 分 
配 内 存 ,标准 库 肯定 是 
知道 此 内 存 的 大 小 的 。 
遗憾 的 是 ，ANSI C 没 
有 提供 公开 内 存 大 小 
的 函数 。 





# 这 样 的 操作 称 为 压缩 


( compaction )。 


# 可 是 ,在 现行 的 大 部 分 


处 
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理 环 


值 被 初 
0， 指 针 被 初始 化 为 空 
指针 。 这 无 疑 是 多 此 一 


举 ] 


六 随 


K&R 的 


也 将 





境 中 , 浮 点 数 的 
始 化 为 浮 点 数 


问题 复杂 化 。 


便 提 一 下 ,实际 上 在 





第 1 版 中 ， 只 


记载 了 calloc() 和 


cfreeO 的 配对 函数 , 并 


没有 记载 mallocO 。 


2.6.6 malloc() 以 外 的 动态 内 存 分 配 函 数 
本 书 介绍 mallocGO 以 外 的 动态 内 存 分 配 函 数 , 首先 介绍 cal1oc() 函数 。 


#include <stdlib.h> 


void xcalloc(size_t nmemb, size_t size) 


callocO 使 用 和 mallocC) 相 同 的 方式 分 配 nmemb x size 大 小 的 内 存 区 
域 , 并 日 将 该 区 域 清 零 返回 。 也 就 是 说 , cal1ocO 和 下 面 的 代码 具有 同等 效果 。 


p = malloc(nmemb * size); 
memset(p, 0, nmemb * size); 


老实 说 ,我 对 C 语言 提供 这 个 函数 的 意图 完全 无 法 理解 。 通 过 两 个 参数 
传递 区 域 的 尺寸 ,实际 上 只 是 在 内 部 做 乘法 运算 ,这 点 就 让 人 费解 。 将 区 域 
清 零 返回 这 一 点 也 让 人 感觉 别扭 。 因 为 就 算 通 过 memset O) 清 零 ， 在 浮 点 数 和 
指针 的 情况 下 它们 的 值 也 不 一 定 为 0 ( 也许 是 空 指针 ) “。 


calloc() 对 于 避免 难以 再 现 的 bug 是 有 效 的 。 我 一 般 是 给 mallocG) 披 一 
张 皮 ， 但 不 是 清 零 ， 而 是 填充 一 个 无 意义 的 值 0xCC。 对 于 在 那些 没有 好 好 做 
初始 化 的 程序 中 发 现 bug， 我 的 方式 肯定 更 好 一 些 。 


此 外 , 在 K&R 的 第 一 版 中 有 一 个 cfree() 函数 , 看 上 去 好 像 可 以 利用 这 
个 函数 释放 由 callocO 分 配 的 内 存 。 其 实 这 个 函数 和 freeO 做 的 事 完 全 一 
样 。 现 在 , 为 了 维持 向 后 的 兼容 性 , 在 大 部 分 的 环境 中 仍然 可 以 使 用 cfree()。 
但 是 ANSI C 的 标准 中 是 不 存在 这 个 函数 的 。 就 算 你 使 用 了 calloc()， 在 释 
放 内 存 的 时 候 也 请 使 用 free() 。 


要 点 
不 要 使 用 cfree()。 




























































































还 有 一 个 内 存 分 配水 数 是 realloc(。 
此 函数 用 于 改变 已 经 通过 mallocO 〇 分 配 的 内 存 的 尺寸 。 


#include <stdlib.h> 




















void *realloc(void *ptr, size_t size); 


reallocQ) 将 ptr 指定 的 区 域 的 尺寸 修改 成 size， 并 且 返 回 指向 新 的 内 
存 区 域 的 指针 。 


话 虽 这 么 说 ， 但 正如 前 面 说 明 的 那样 ，mal1ocGO) 不 是 一 个 魔法 函数 ， 
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reallocGO) 同样 如 此 。 通 常 ， 我 们 使 用 real1ocGO) 来 扩展 内 存 区 域 。 如 果 通 
过 ptr 传递 的 区 域 后 面 有 足够 大 小 的 空闲 空间 ， 就 直接 实施 内 存 区 域 扩展 。 
但 是 ， 如 果 后 面 的 区 域 没 有 足够 多 的 空闲 空间 ， 就 分 配 其 他 新 的 空间 ， 然 后 
将 内 容 复制 过 去 。 


我 们 经 常 需要 对 数组 顺 次 追加 元 素 ， 这 种 情况 下 ， 如 果 每 追加 一 个 元 素 
都 利用 realloc() 进 行内 存 区 域 扩 展 ， 将 会 发 生 什么 呢 ? 


如 果 手 气 不 错 ， 后 面 正 好 有 足够 大 的 空地 儿 ， 这 样 还 好 。 如 果 不 是 这 样 ， 
就 需要 频繁 地 复制 区 域 中 的 内 容 ， 这 样 自 然 会 影响 运行 效率 。 另 外 ,不 断 地 对 内 
存 进行 分 配 、 释 放 的 操作 ， 也 会 引起 内 存 碎片 化 。 此 时 不 妨 考虑 一 下 这 种 手法 : 
假设 以 100 个 元 素 为 单位 ， 一 旦 发 现 空间 不 足 ， 就 一 次 性 进行 内 存 扩展 分 配 。 

此 外 ,一 旦 利用 reallocGO 扩 展 巨 大 的 内 存 区 域 ， 除 了 在 复制 上 花费 很 
多 时 间 之 外 ， 也 会 造成 堆 中 大 量 的 空间 过 分 地 活跃 。 如 果 想 要 动态 地 为 大 量 的 
元 素 分 配 内 存 空 间 ， 最 好 不 要 使 用 连续 的 内 存 区 域 ， 而 是 应 该 积极 使 用 链表 。 


要 点 
请 谨慎 使 用 realloc()。 






















































































另外 ， 如 果 通 过 ptr 向 reallocQO 传 人 NULL，realloc0 〇 的 行为 就 和 
malloc() 完 全 相同 。 偶 尔 会 见 到 像 下 面 这 样 的 代码 ， 


if (p == NULL) { 
p = malloc(size); 
} else { 
p = realloc(p, size); 











} 
完全 可 以 简洁 地 写成 下 面 这 样 ， 

p = realloc(p, size); 
(姑且 先 把 返回 NULL 的 问题 放 在 一 边 * )。 


随便 说 一 下 ， 如 果 通 过 size 向 reallocQ 传 人 0，realloc0 〇 的 行为 就 
和 freeGO 完 全 相同 。 





全 二 补 
名 充 malloc() 的 返回 值 检 查 


内 存 分 配 一 旦 失败 ，malloc() 会 返回 NULL。 


# Java 的 java.uti]1.Vector 
类 就 是 采用 了 这 个 手 
法 。 但 是 本 质 上 ，Java 
并 不 背离 堆 的 机 制 。 


* 对 于 这 种 写法 ， 
realloc() 返 回 NULL 
的 时 候 , p 会 永远 被 丢 
失 ， 这 是 一 个 问题 。 
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大 部 分 C 的 书籍 都 歌 斯 底 里 地 提醒 大 家 “如 果 你 调用 了 malloc(), 就 
必须 做 返回 值 检查 ”"， 关 于 这 一 点 ， 本 书 倒是 要 对 此 唱 唱 反 调 。 不 是 吗 ? 那 
么 做 太 麻 烦 了 。 

完美 地 对 应 内 存 不 足 的 问题 ， 

p = malloc(size); 

if (p == NULL) { 

return OUT_OF_MEMORY_ERROR; 

} 

并 不 是 像 上 面 这 样机 械 地 写 一 段 代码 那么 单纯 的 。 

当然 我 们 在 构造 某 些 数据 结构 的 时 候 ， 既 需要 确保 数据 结构 自身 没有 
任何 矛盾 ， 还 要 确保 函数 能 够 返回 ， 随 之 而 来 的 测试 也 会 变 得 更 加 复杂 。 
假设 能 够 做 到 这 些 ， 却 又 因为 分 配 已 达 上 限 字 节 数 的 内 存 区 域 而 失败 ， 此 
时 我 们 又 该 怎么 办 呢 ? 


口 通 过 对 话 框 通知 用 户 “ 内 存 不 足 ”? 此 时 ， 也 许 程序 自身 已 经 没有 
能 力 弹出 对 话 框 了 ……… 

口 为 了 不 丢失 写 到 一 半 的 文档 数据 ， 寻 且 将 文件 保持 打开 状态 ……… 

能 做 到 吗 ? 

口 安全 起 见 ， 通 过 递归 的 方式 遍历 深层 次 的 树 结构 …… 可 以 分 配 栈 的 

空间 吗 ? 

口 还 是 先 保护 硬盘 数据 吧 …… 对 于 Windows 这 样 存 放 了 交换 文件 的 文 
件 系统 , 如 果 此 时 恰恰 只 有 一 个 分 区 , 硬盘 数据 又 会 出 现 什么 状况 呢 ? 


其 实 并 不 是 只 有 显 式 的 mal1ocG) 调 用 才 会 导致 内 存 不 足 , 深度 的 递归 
调用 也 会 引起 栈 内 存 不 足 。 此 外 ,根据 不 同情 况 ，printf() 内 部 有 时 也 会 
调用 malloc()。 不 光 是 mal1loc() 调 用 ， 操 作 系 统 往 内 存 中 写 入 数据 的 时 
候 也 会 进行 内 存 区 域 分 配 ， 对 于 这 种 情况 , 调用 malloc() 时 是 无 法 发 现 内 
存 不 足 的 。 

开发 通用 性 极 高 的 库 程 序 的 时 候 ,“ 切 实地 进行 返回 值 检 查 ” 的 确 是 必 
须 的 。 但 是 如 果 是 开发 普通 的 应 用 程序 ， 只 需要 给 mal1loc() 披 上 一 张 皮 ， 
一 旦 发 生 内 存 不 足 ， 当 场 输 出 错误 信息 并 且 终 止 该 程序 ， 这 种 做 法 在 很 多 
时 候 也 是 可 行 的 。 主 张 


“一 旦 调用 malloc()， 绝 对 要 对 返回 值 进 行 检查 
完善 的 处 理 。 
的 人 ， 一 般 在 使 用 Java 时 ， 一 定 会 在 合适 的 层次 上 使 用 catch， 当 然 他 们 
也 不 会 去 使 用 Perl 等 等 的 Shell 脚本 …… 





3 
亚 
样 
= 





2.6 利用 malloc0) 来 进行 动态 内 存 分 配 ( 堆 ) 
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补 
[2 充 程序 结束 时 必须 调用 free() 吗 ? 


网 上 的 新 闻 组 fj.comp.lang.c 曾经 针对 下 面 的 主题 发 生 过 一 次 激烈 的 口 
水 战 。 


程序 结束 之 前 ,一定 需 要 释放 malloc() 分 配 的 内 存 吗 ? 


这 是 一 个 让 人 头疼 的 问题 。 在 现实 中 ,如 果 是 普通 PC 上 使 用 的 操作 系 
统 ， 在 进程 结束 时 ， 肯 定 会 释放 曾经 分 配给 当前 进程 的 内 存 空 间 。 

其 实 C 语言 标准 却 并 没有 规定 必须 要 这 么 做 ， 只 是 正经 的 操作 系统 都 
主动 提供 这 个 功能 。 此 外 ， 在 写 推荐 内 存 为 128MB 的 程序 时 ， 你 不 会 去 考 
虑 以 后 还 要 将 它 移植 到 电视 机 巡 控 器 的 说 入 式 芯 片上 吧 。 也 就 是 说 ， 在 程 
序 结束 之 前 ， 没 有 必要 调用 free()。 

可 是 ， 对 于 进行 “ 读 取 一 个 文件 一 处 理 一 输出 结果 一 结束 ”这 样 的 处 
理 ， 如 果 要 扩展 成 可 以 连续 处 理 多 个 文件 ,一旦 原来 的 程序 没有 调用 
free() ， 后 面 的 人 那 可 真 的 遭 罪 了 。 

为 了 提前 发 现 内 存 溢出 ( 忘 了 调用 free() ) 的 漏洞 ， 最 近 出 现 了 一 些 
工具 ， 它 可 以 报告 那些 没有 在 结束 时 被 实施 free() 的 内 存 区 域 的 列表 。 此 
时 ,“ 故 意 不 调用 free() 的 区 域 ” 和 “忘记 调用 free() 区域 ”被 混同 在 一 
起 出 现在 报告 中 ， 让 人 难以 区 分 。 对 于 不 能 使 用 这 些 工具 的 开发 环境 ， 可 
以 采用 “将 malloc() 和 free() 披 上 一 张 皮 ， 然后 计算 它们 被 调用 的 次 数 ， 
并 且 确 认 程 序 结束 时 次 数 是 否 一 致 ”这 样 简单 可 行 的 方法 ， 并 且 这 种 方法 
对 于 检查 内 存 泄漏 非常 有 效 。 

从 这 一 点 上 来 看 ， 我 认为 “对 于 调用 malloc() 分 配 的 内 存 区 域 ， 在 程 
序 结束 前 一 定 要 调用 free()” 这 样 的 原则 也 是 相当 合理 的 。 

那么 到 底 应 该 怎么 做 ? 答案 是 “具体 问题 具体 分 析 ”( 我 倒 ! 跟 没 说 一 样 ) 

我 倒是 不 太 喜 欢 “ 必 定 free() 派 ”的 观点 , 其 实 之 所 以 “必定 free()”， 
是 因为 他 们 认为 : 

口 使 用 malloc() 之 后 写 上 对 应 的 free() 是 一 种 谨慎 的 编程 风格 

口 程序 员 就 应 该 留意 将 malloc() 和 free() 对 应 起 来 

口 “调用 了 exit()， 就 没有 必要 调用 free() 了 ”这 种 想法 是 不 负责 任 
并 且 恶 劣 的 编程 风格 

不 管 怎么 说 程序 员 也 是 人 ( 瞧 这 话说 的 )， 对 于 人 来 说 ， 丽 怕 会 犯错 的 
地 方 必定 犯错 。 明 明 如 此 ， 你 还 去 标榜 什么 “ 写 程 序 要 谨慎 ”， 我 觉得 有 点 
自 讨 没 趣 。 





* 
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比如 , 即使 char 为 9bit 
的 处 理 环境 ( 如 果真 的 
存在 )，sizeof(char) 
值 也 是 1。 标 准 就 是 这 
么 定义 的 。 


如 果 需 要 获得 结构 体 
成 员 距 离 初始 位 置 的 
偏 移 量 ， 一 般 使 用 
stddefh 中 定义 的 宏 
offsetof() 。 使 用 这 
个 宏 , 不 需要 声明 哑 交 
量 (dummy ) 也 可 以 
获取 偏 移 量 。 


“谨慎 地 ”编程 有 那么 了 不 起 吗 ? 我 认为 那些 能 尽力 让 自己 摆脱 “麻烦 
事 ” 的 程序 员 才 是 优秀 的 。 该 脱手 时 就 脱手 ， 尽 可 能 依赖 工具 去 完成 检查 
工作 而 不 是 总 去 目测 。 就算 在 那些 无 论 如 何 也 要 依靠 手动 去 应 对 的 情况 下 ， 
也 上 暗自 发 伏 “ 总 有 一 天 我 把 它 做 成 自动 化 "。 此 类 程序 员 才 是 人 才 !1 


2.7 内存 布局 对 齐 


稍微 转换 一 下 话题 …… 
假设 有 下 面 这 样 的 一 个 结构 体 : 


typedef struct { 
int intl1; 
double doublel; 
char charil; 
double double2; 
} Hoge; 
在 我 的 环境 中 ，sizeof(int) 的 结果 为 4，sizeof(double) 的 结果 为 8， 
随便 说 一 下 ,根据 C 标 准 ，sizeof(char) 的 结果 必定 为 1 。 敢 问 阁下 ,这 个 
结构 体 的 尺寸 是 多 大 ? 


4+8+1+8=21 个 字 节 一 一 儿 乎 在 所 有 的 情况 下 ,这 个 答案 都 是 错误 的 。 
在 我 的 处 理 环境 中 ， 答 案 是 24 个 字 节 。 


还 是 通过 程序 做 个 实验 吧 ( 参照 代码 清单 2-8 )。 


声明 一 个 Hoge 类 型 的 变量 ， 然 后 将 各 成 员 的 地 址 输出 。 











代码 清单 2-8 alignment.c 

1: #include <stdio.h> 

2 

3: typedef struct { 

4: int intl1; 

Ds double doublel; 
6 : char charl; 

7: double double2; 
8: } Hoge; 

9: 
10: int main(Cvoid) 

11: { 

12 : Hoge hoge; 
13 : 

14: printf("hoge size..%d\n", sizeof(Hoge)); 
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15: 

16: printf("hoge ..%p\n", &hoge); 

17: printf(C"int1 . .%pNn"，&hoge .int1) ; 

18 : printf("doublel..%p\n", &hoge.doublel); 
19: printf("charl ..%p\n", &hoge.charl); 
20 : printf("double2..%p\n", &hoge.double2); 
21: 

22: return 0; 

23: } 











我 的 环境 中 的 运行 结果 如 下 : 





hoge size..24 
hoge ..0xbfbfd9d0 
int1  ..0xbfbfd9d0 


double1. .0xbfbfd9d4 
char1  ..0xbfbfd9dc 
double2. .0xbfbfd9e0 





观察 运行 结果 可 以 发 现 ，char1 的 后 面 空 出 来 一 块 。 


这 是 因为 根据 硬件 ( CPU ) 的 特征 , 对 于 不 同 数据 类 型 的 可 配置 地 址 受到 
一 定 限 制 。 或者， 即使 可 以 配置 ， 某 些 CPU 的 效率 也 会 降低 。 此 时 ， 编 译 器 
会 适当 地 进行 边界 调整 〈 布局 对 齐 )， 在 结构 体内 插入 合适 的 填充 物 。 






































Oxbfbfd9d0 
Oxbfbfd9d4 
Oxbfbfd9d8 
Oxbfbfd9dc 
0xbfbfd9e0 


Oxbfbfd9e4 double2 








图 2-16 布局 对 齐 





根据 这 个 实验 ， 在 我 的 环境 中 ，int 和 double 被 配置 在 4 的 倍数 的 地 
址 上 。 


布局 对 齐 处 理 有 了 时候 也 在 结构 体 的 末尾 进行 ， 这 是 由 于 有 时 候 需 要 构造 
结构 体 数组 的 缘故 。 针 对 这 样 的 结构 使 用 sizeof 运算 符 , 会 返回 包含 末尾 对 
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齐 字 节 的 结构 体 长 度 。 将 结果 和 元 素 个 数 相 乘 ， 就 可 以 获得 整个 数组 的 
大 小 。 

此 外 ，mal11ocGO) 会 充分 考虑 到 各 种 类 型 的 长 度 ， 返 回调 整 后 最 优化 的 地 
址 。 局 部 变量 等 也 会 被 配置 到 优化 调整 后 的 地 址 上 。 

布局 对 齐 操作 是 根据 CPU 的 情况 进行 的 。 因 此 ， 根 据 CPU 的 不 同 ， 布 
局 对 齐 填充 的 方式 也 不 同 。 在 我 的 环境 中 ，double 可 以 被 配置 在 4 的 倍数 的 
地 址 上， 但 在 很 多 CPU 上 ，double 只 能 被 配置 在 8 的 倍数 的 地 址 上 。 

偶尔 ， 也 会 有 人 比较 讨厌 布局 对 齐 方式 对 硬件 的 依赖 ， 通 过 手工 调整 边 
界 来 提高 可 移 值 性 。 


typedef struct { 
int int1; 












































char pad1[4]; 一 一 通过 手工 填充 
double doublel; 
char charil; 
char pad2[7]; 一 一 这 里 也 是 
double double2; 

} Hoge; 


可 是 ， 这 么 做 究竟 有 什么 作用 呢 ? 


即使 不 这 么 做 ,编译 器 也 会 根据 CPU 的 情况 帮 有 我 们 进行 适当 的 边界 调整 。 
如 有 果 只 是 引用 成 员 名 ， 就 根本 没有 必要 去 理会 布局 对 齐 方 式 。 


如 果 需 要 将 结构 体 照 原样 ( 通过 fwrite() ) 输出 到 文件 中 , 由 于 CPU 
的 不 同 ， 在 其 他 机 器 上 想 要 读 取 这 个 结构 体 的 时 候 ， 对 齐 方式 的 不 同 可 能 
导致 问题 。 那 么 ,通过 手工 方式 调整 边界 ， 说 不 定 某 全 机 右上 输出 的 数据 ， 
也 能 被 其 他 机 器 读 取 。 可 是 无 论 怎样 ， 这 只 不 过 是 偶尔 才 可 以 拿 出 来 说 的 
例子 。 


在 上 面 的 例子 中 ，pad1 的 尺寸 为 4，pad2 的 尺寸 为 7。 究 竟 这 些 数 字 是 
怎么 冒 出 来 呢 ? 连 标准 也 不 能 保证 sizeof(int) 为 4, sizeof(double) 为 8。 
将 这 些 数字 直接 写 在 程序 中 ， 还 说 什么 “为 了 提高 可 移植 性 ”……… 

是 说 ， 手 工 插入 填充 物 的 方法 ， 即 使 可 以 让 不 同 机 器 的 数据 交换 成 
， 也 只 不 过 是 敷衍 逃避 。 原 型 开发 也 许 会 允许 使 用 这 种 方式 ， 但 是 如 
关中 进行 数据 交换 ， 将 结构 体 按 照 原 样 写 入 到 文件 的 方式 本 身 就 是 个 
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另外 , 即使 是 sizeof(int) 为 4 的 处 理 环 境 , 其 内 部 表现 也 不 一 定 相 同 。 
关于 这 一 点 ， 下 一 会 进行 说 明 。 


要 点 


即使 手工 进行 布局 对 齐 ， 也 不 能 提高 可 移植 性 。 


2.8 字 节 排序 


我 的 环境 是 在 普通 PC (CPU 为 Celeron ) 上 安装 了 FreeBSD3.2。 sizeof(int) 








为 4， 但 在 这 4 个 字 节 中 ， 整 数 究竟 是 以 什么 样 的 形式 存放 的 呢 ? 
这 里 依然 使 用 一 个 程序 来 验证 问题 (代码 清单 2-9 )。 





代码 清单 2-9 byteorder.c 














1 #include <stdio. 
2 

3 int main(Cvoid) 

4: 工 

5 int 

6 

7 

8: printf("%x\n" 
9: printf("%x\n" 
10: printf("%x\n" 
11: printf("%x\n" 
12: 
13: return 0; 
14: 了 


h> 


hoge = 0x12345678 ; 
unsigned char *hoge_p = (unsigned char*)&hoge; 


，hoge_p[0]); 
，hoge_p[1]); 
，hoge_p[2]); 
，hoge_p[3]); 























程序 中 将 int 型 变量 的 地 址 强制 赋 给 unsigned char * 型 变量 hoge_p， 
因此 ,我 们 可 以 使 用 hoge_p[0]~hoge_p[3] 以 字 节 为 单位 引用 hoge 的 内 容 。 


我 的 环境 中 ， 程 序 的 执行 结 





78 
56 


34 
12 








如 下 : 








对 于 我 的 环境 , “0x12345678” 在 内 存 中 好 像 是 逆向 存放 的 呢 。 


可 能 有 读者 会 感到 意外 。 其 实 Intel 的 CPU (包括 AMD 等 兼容 CPU )， 
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* Java 也 规定 了 这 一 点 。 
因此 ,如 果 硬 件 不 支持 
IEEE 754, 情况 就 会 变 
得 复杂 一 点 。 


都 是 像 这 样 将 整数 颠倒 过 来 存放 的 ,这 种 配置 方式 一 般 称 为 小 端 ( little-endian ) 
字 节 序 。 


此 外 ， 对 于 工作 站 等 的 CPU， 经 常 将 “0x12345678” 这 样 的 值 以 “12， 
34，56，78” 的 顺序 存放 ， 这 种 配置 方式 称 为 大 端 (big-endian ) 字 节 序 。 


那么 ， 小 端 和 大 端 这 样 的 字 节 排列 方式 就 称 为 字 节 排序 ( Byte Order )。 


小 端 和 大 端 哪 一 种 方式 会 更 好 ? 这 个 问题 如 同 辩论 宗教 取向 一 样 邻 人 纠 
结 ， 在 这 里 我 们 就 不 做 深入 讨论 了 。 事 实 是 它们 各 有 所 长 。 在 纸 和 笔 的 时 代 ， 
人 类 在 做 加 法 运算 时 都 是 从 低位 开始 的 ， 可 是 对 于 CPU 来 说 采用 小 端 方式 会 
更 轻松 。 当 然 ， 对 于 人 类 来 说 ， 大 端的 方式 也 许 更 容易 理解 。 

问题 就 在 于 ， 连 以 上 这 样 整数 类 型 的 数据 在 内 存 中 的 配置 方式 都 因 CPU 
的 不 同 而 不 同 。 

事实 上 ， 有 的 CPU 还 会 采用 “将 两 个 字 节 编 成 一 组 再 反 向 排列 ”这 样 差 
异性 更 大 的 字 节 排列 方式 。 此 外 ， 很 多 环境 使 用 IEEE 754 规定 的 形式 处 理 浮 
点 类 型 ,但 C 的 标准 并 没有 规定 这 一 点 "。 即 使 是 采用 IEEE 754 的 处 理 环境 ， 
Intel 的 CPU 也 还 是 逆向 排列 字 节 的 。 

也 就 是 说 ， 根 据 环境 的 不 同 ， 内 存 中 的 二 进 制 映像 的 形式 也 不 尽 相同 ， 
所 以 那些 试图 将 内 存 的 内 容 直接 输出 到 硬盘 ， 或 者 通过 网 络 进行 传输 以 便 不 
同 的 机 器 读 取 等 想法 都 是 不 可 取 的 。 


如 果 要 考虑 数据 兼容 性 ， 建 议 自 定义 一 些 数据 格式 ， 然 后 遵循 这 些 格 式 
来 输出 数据 。UNIX 的 XDR 等 工具 可 以 在 这 一 点 上 为 我 们 提供 帮助 。 


要 点 
无 论 是 整数 还 是 浮 点 小 数 ， 内 存 上 的 表现 形式 都 随 环 境 的 不 同 而 不 同 。 


2.9 ”关于 开发 语言 的 标准 和 实现 一 一 
对 不 起 ， 前 面 的 内 容 都 是 忽悠 的 


直到 这 里 ， 都 是 在 我 的 环境 中 实际 地 运行 程序 ， 然 后 结合 输出 结果 进行 
各 种 各 样 的 说 明 。 

但 是 , C 标 准 并 不 是 根据 实现 方式 制定 的 , 而 是 根据 对 开发 语言 的 需求 来 
制定 的 。 
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比如 ,如 今 大 多 的 PC 和 工作 站 的 操作 系统 都 为 我 们 实现 了 虚拟 地 址 功能 ， 
但 是 对 于 那些 不 具备 此 功能 的 操作 系统 ，C 语言 编写 的 应 用 程序 同样 能 跑 得 
很 欢 。 


此 外 ， 前 面 介绍 了 “C 语言 将 自动 变量 分 配 在 栈 中 "。 其 实 ， 这 一 点 并 没 
有 在 标准 中 做 出 规定 。 因 此 ， 即 使 在 每 次 进入 函数 的 时 候 将 自动 变量 配置 到 
堆 中 ， 也 不 算 违 反 标 准 。 只 是 这 种 实现 非常 慢 ， 没 有 人 会 思春 到 这 种 地 步 
罢了 。 


至 于 malloc() 的 实现 ， 在 不 同 的 处 理 环境 中 也 存在 很 大 的 差异 。 除 了 
brkQ 〇 这 样 UNIX 特有 的 系统 调用 之 外 , 最 近 也 出 现 了 这 样 的 分 配方 式 : 在 分 


配 较 大 的 内 存 空间 时 ， 使 用 系统 调用 mmap() ， 之 后 通过 free() 将 内 存 返 回 可 ne 
ee * 默认 地 不 一 定 被 关联 
BN 到 那里 。 





























进一步 说 , 第 1 章 的 内 容 都 是 以 “指针 就 是 地 址 ”为 前 提 进 行 说 明 的 。 
可 是 关于 这 一 点 ， 在 标准 中 连 一 个 字 也 没有 提 到 。 正 如 前 面 摘录 的 内 容 一 样 ， 
标准 中 只 提 到 “指针 类 型 描述 一 个 对 象 ， 该 类 对 象 的 值 提供 对 该 引用 类 型 实 
体 的 引用 ”。 也 就 是 说 ， 如 果 连 实体 都 能 够 被 引用 ， 即 使 你 不 使 用 虚拟 地 址 也 
不 违反 标准 。 

在 标准 中 ，& 运 算 符 被 称 为 “地 址 运算 符 ”， 这 就 让 人 有 点 糊涂 ， 具 体 的 
说 明 是 : 


一 元 & ( 地址 ) 运算 符 的 结果 是 指向 由 其 操作 数 所 表示 对 象 或 函 
数 的 指针 。 


无 论 怎样 ， 此 运算 符 返 回 的 是 “指针 ”， 而 不 是 “地 址 ”。 


通过 %p，printf() 的 输出 结果 被 定义 成 : 





















































该 指针 的 值 将 以 实现 定义 的 方式 转换 为 一 系列 可 打印 的 字符 。 
由 于 C 语言 经 常 通过 指针 的 形式 让 我 们 可 以 直接 接触 到 地 址 ， 所 以 人 们 
常常 误 以 为 : 
口 如 果 没 有 养 成 经 常 关注 内 容 状 态 的 习惯 ,是 不 适合 进行 C 语言 编程 的 
DC 语言 其 实 就 是 结构 化 的 汇编 
DC 语言 其 实 是 低级 语言 
但 对 于 开发 应 用 程序 的 普通 程序 员 ， 其 实 完全 没有 必要 去 理会 指针 就 是 
地 址 这 件 事 。 





















































104 ”第 2 章 做 个 实验 见 分 晓 一 一 C 是 怎么 使 用 内 存 的 








可 能 C 语言 确实 就 是 低级 语言 。 也 许 有 人 想 说 : 
明明 想 使 用 高 级 语言 ， 只 是 在 不 得 已 用 了 C 语言 的 情况 下 ,还 

装 腔 作 热 刻意 地 来 一 句 “ 哈 ? C 难道 不 是 低级 语言 吗 ”， 并 以 此 来 标 

榜 自 己 能 够 使 用 低级 语言 编程 ， 这 样 可 以 让 他 人 高 看 自己 一 眼 。 

其 实 不 是 这 样 的。 你 明知 处 理 环境 中 指针 就 是 地 址 ， 却 对 此 选择 性 失明 ， 
并 且 坚 持 抱 着 “如 果 将 C 当成 高 级 语言 ，C 就 可 以 像 高 级 语言 那样 使 用 ”的 
想法 。 那 么 ， 等 待 你 的 将 是 成 群 的 bug。 

本 章 也 是 在 强调 “指针 就 是 地 址 ”的 基础 之 上 ， 展 开 各 部 分 内 容 的 。 

比 起 噶 踪 叫 明 地 进行 那些 抽象 的 说 明 ， 上 具体 地 将 地 址 表现 出 来 的 方式 是 
不 是 更 直观 ? 将 自动 变量 的 地 址 表示 出 来 ， 你 一 下 子 就 能 看 到 栈 是 如 何 随 着 










































































函数 调用 的 发 生 而 不 断 增长 的 。 如 果 你 没有 理解 这 一 点 ， 你 同样 也 无 法 理解 
递归 调用 的 原理 。 














此 外 , 在 大 部 分 的 运行 环境 中 ，C 语言 不 做 运行 时 检查 ,这 已 经 是 无 法 回 
避 的 现实 。 因 此 ， 如 果 没 有 在 某 种 程度 上 掌握 内 存 的 使 用 方式 ， 正 常 的 调试 
工作 就 会 遇 到 麻烦 。 


另外 ， 遇 到 不 明白 的 地 方 ， 应 该 通过 实验 来 确认 。 俗 话说 得 好 ， 实 践 出 
真知 ! 


对 于 本 章 的 例 程 ， 请 大 家 一 定 亲 手 在 自己 的 环境 中 尝试 运行 一 下 。 
但 是 , 一 旦 大 家 通过 实验 接受 了 “指针 就 是 地 址 ”这 个 观点 ， 就 应 该 对 
此 提高 警惕 ， 否 则 你 就 会 顺手 写 出 一 些 抽象 度 和 移植 度 低 下 的 程序 。 


此 外 , 一 旦 出 现 bug, 请 带 着 “指针 就 是 地 址 ”的 观点 去 解决 它 一 一 这 种 
姿态 在 解决 bug 上 是 恰到好处 的 。 
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下 
揭秘 C 的 语法 一 一 它 到 底 是 怎么 回 事 


3.1 解读 C 的 声明 


3.1.1 用 英语 来 阅读 

在 1.2.2 市 的 补充 内 容 中 ， 我 认为 像 

int *hoge_p; 
还 有 

int hoge[10]; 
这 样 的 声明 方式 很 奇怪 。 

对 于 这 种 程序 的 声明 方式 ， 可 能 也 有 很 多 人 感觉 不 到 有 什么 别扭 的 地 方 。 
那 就 再 看 下 面 的 这 个 例子 (经 常 被 使 用 ): 

char x*color_name[] = { 

"red" 


"green" 
"plue", 





} 
这 里 声明 了 一 个 “指向 char 的 指针 的 数组 ”。 

正如 2.3.2 节 中 介绍 的 那样 ， 可 以 像 下 面 这 样 声 明 一 个 “指向 将 double 
作为 参数 并 且 返 回 int 的 函数 的 指针 ”: 


int (x*func_p) (double); 
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* 在 KR 中 ,登载 了 dc] 
这 个 解析 C 的 声明 的 
程序 ,同时 也 记载 了 程 
序 的 输出 结果 ,但 是 日 
语 版 并 没有 对 这 一 段 
进行 翻译 ,而 是 一 成 不 
变 地 转载 了 英文 原文 。 


关于 这 样 的 声明 ， 在 K&R 中 有 下 面 这 样 一 段 说 明 : 





int x*f(); /* 下 返回 指向 1Tnt 指针 的 函数 */ 
和 

int (x*pf)();  /* pf: 指向 返回 int 的 函数 的 指针 #/ 

这 两 个 声明 最 能 说 明 问题 。 在 这 里 ， 因 为 * 是 前 置 运算 符 ， 它 的 

优先 级 低 于 ()， 为 了 让 连接 正确 地 进行 ， 有 必要 加 上 括号 。 

首先 ， 这 段 文字 中 有 谎言 。 

声明 中 *、QO 和 [] 并 不 是 运算 符 。 在 语法 规则 中 ， 运 算 符 的 优先 顺序 是 在 
别 的 地 方 定义 的 。 


先 将 这 个 问题 放 在 一 边 。 如果 你 老 老 实 实地 去 读 这 上段 文字 , 该 会 跑 咕 “是 
不 是 搞 反 了 ”。 如 果 说 
int (*pf) O; 
是 指向 函数 的 指针 ， 使 用 括 弧 先 将 星 号 ( 指针 ) 括 起 来 岂 不 是 很 奇怪 ? 
这 个 问题 的 答案 , 等 你 明白 过 来 就 会 觉得 非常 简单 。C 语言 本 来 是 美国 人 
开发 的 ， 最 好 还 是 用 英语 来 读 。 
以 上 的 声明 ， 如 果 从 pf 开始 以 英语 的 顺序 来 读 ， 应 该 是 下 面 这 样 : 
pf is pointer to function returning int 
翻译 成 中 文 ， 则 为 
pf 为 指向 返回 int 的 函数 的 指针 。 


















































要 点 
用 英语 来 读 C 的 声明 。 


3.1.2 解读 C 的 声明 
在 这 里 ， 向 读者 介绍 阅读 C 语言 声明 的 方法 : 机 械 地 向 前 读 。 


为 了 把 问题 变 得 更 简单 , 我 们 在 这 里 不 考虑 const 和 volatile。(3.4 节 
考虑 了 const ) 接 下 来 遵循 以 下 步骤 来 解释 C 的 声明 。 
@ 首先 着 眼 于 标识 符 (变量 名 或 者 函数 名 )。 
@ 从 距离 标识 符 最 近 的 地 方 开始 , 依照 优先 顺序 解释 派生 类 型 ( 指针 、 数 
组 和 函数 )。 优 先 顺序 说 明 如 下 ， 
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QD 用 于 整理 声明 内 容 的 括 弧 
己 用 于 表示 数组 的 [] ， 用 于 表示 函数 的 QO 
@) 用 于 表示 指针 的 * 


@ 解释 完成 派生 类 型 , 使 用 “of”、“to”、“returning” 将 它们 连接 起 来 。 
@ 最 后 ， 追 加 数据 类 型 修饰 符 〈 在 左边 ，int、double 等 )。 
@ 英语 不 好 的 人 ， 可 以 倒序 用 日 语 (或 者 中 文 ) "解释 。 


数组 元 素 个 数 和 函数 的 参数 属于 类 型 的 一 部 分 。 应 该 将 它们 作为 附 
于 类 型 的 属性 进行 解释 。 
比如 ， 
int (C*func_p)(double) ; 
@ 首先 着 眼 于 标识 符 。 
int (*func_p) (double); 
英语 的 表达 为 : 
func_p is 
@ 因为 存在 括号 ， 这 里 着 眼 于 *。 
int (*func_p) (double); 
英语 的 表达 为 : 
func_p is pointer to 
@ 解释 用 于 函数 的 () ， 参 数 是 double。 
int (*func_p) (double); 
英语 的 表达 为 : 
func_p is pointer to function(double) returning 
@ 最 后 ,解释 数据 类 型 修饰 符 int。 
int (*func_p) (double); 
英语 的 表达 为 : 


func_p is pointer to function(double) returning int 























al 









































如 





© 





上 同样 可 以 倒序 用 








P 文 解释 。 一 一 译 者 注 
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六 其 实 ， Java 的 大 部 分 
声明 语法 还 是 能 做 到 
这 点 的 。 


@ 翻译 成 中 文 : 


func_p 是 指向 返回 int 的 函数 的 指针 。 





使 用 和 上 面相 同 的 方式 ,我 们 对 各 种 各 样 的 声明 进行 解读 ， 如 下 表 ( 表 3-1 )。 





表 3-1 解读 各 种 各 样 的 C 语 言 声明 
C 语 言 英语 表达 中 文 表达 
int hoge; hoge is int hoge 是 int 


int hoge[10] ; 


int hoge[10] [3]; 


int x*hoge[10]; 


double (*hoge) [3] ; 


int funcCint a); 


int (xfunc_p)Cint a) ; 


hoge is array( 元 素 个 数 10) of 
int 

hoge is array( 元 素 个 数 10) of 
array( 元 素 个 数 3) of int 
hoge is array( 元 素 个 数 10) of 
pointer to int 

hoge is pointer to array( 元 素 个 
数 3) of double 

func is function( 参 数 为 int a) 
returning int 

func_p is pointer to function( 参 
数 为 int a) returning int 


hoge 是 int 的 数组 (元 素 个 数 10) 


hoge 是 int 数 组 (元 素 个 数 3) 的 
数组 (元 素 个 数 10) 

hoge 是 指向 int 的 指针 的 数组 
(元 素 个 数 10) 
hoge 是 指向 double 的 数组 (元 
素 个 数 3) 的 指针 

func 是 返回 int 的 函数 (参数 是 
int a) 
func_p 是 指向 返回 int 的 函数 
(参数 为 int a) 的 指针 





























正如 大 家 看 到 的 这 样 , C 语 言 的 声明 不 能 从 左 往 右 按 顺序 解读 (无 论 是 英 


语 、 中 文 ， 还 是 


日 语 )， 而 是 左右 来 回 地 解读 。 








K&R 中 指出 : 在 C 语 言 中 ， 变 量 的 声明 仿效 表达 式 的 语法 。 可 是 ,勉强 


地 去 模拟 本 质 上 完全 不 同 的 事物 ， 结 


“使 声明 的 形式 和 使 月 
等 语言 ) 特有 的 奇怪 的 语法 。 











K&R 中 同时 也 写 道 : 
C 的 声明 语法 ,特别 是 指向 函数 指针 的 语法 ， 受 到 了 严厉 的 


批评 。 


就 是 “四 不 像 ”。 
上 的 形式 相似 ”是 C (还 有 从 C 派生 的 C++ 、Java- 


在 Pascal 中 ,，C 的 int hoge[10] 可 以 这 样 声 明 ， 


var 
hoge : 


array[0..9] of integer; 








这 种 声明 ， 从 左 向 右 用 英语 按 顺 序 解读 是 完全 没有 问题 的 。 
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顺便 说 一 下 ,C 的 作者 Dennis Ritchie 开发 了 一 种 叫 Limbot" 的 语言 ,Limbo 
中 各 种 标记 的 使 用 方法 , 一 眼 就 可 以 看 出 来 和 C 非常 相似 ", 但 是 声明 语法 完全 * 比如 , 不 使 用 begin~ 
设计 成 Pascal 风格 。 其 实 作者 自身 也 在 反省 C 语 言 的 声明 语法 。 end 或 者 if~endif 


而 是 使 用 中 括号 。 
3.1.3 ”类 型 名 
在 C 中 ， 除 标识 符 以 外 ， 有 时 候 还 必须 定义 “类 型 ”。 
具体 来 说 ， 遇 到 以 下 情况 需 定义 “类 型 ”: 


口 在 强制 转型 运算 符 中 
口 类 型 作为 sizeof 运算 符 的 操作 数 


比如 ， 将 强制 转型 运算 符 写成 下 面 这 样 : 
Cint*) 
这 里 指定 “int*” 为 类 型 名 。 
从 标识 符 的 声明 中 ， 将 标识 符 取 出 后 ， 剩 下 的 部 分 自然 就 是 类 型 名 。 
表 3-2 ”类 型 名 的 写法 

































































声 明 声明 的 解释 类 型 名 类 型 名 的 解释 
int hoge; hoge 是 int int int 类 型 
int *hoge; hoge 是 指向 int 的 指针 int #* 指向 int 的 指针 类 型 
double p 是 指向 double 的 数组 ”double(*)[3] ”指向 double 的 数组 (元 素 个 
C*p) [3]; ( 元 素 个 数 3 ) 的 指针 数 3 ) 的 指针 类 型 
void func 是 指向 返回 void 函 ”void (*)QO 指向 返回 void 函数 的 指针 
Cunc7O; 数 的 指针 类 型 








在 表 3-2 a 括 起 星 号 的 括 弧 (*) 好 像 有 点 多 余 ， 但 是 一 
去 掉 括 弧 ， 意 思 就 完全 不 一 样 了 。 


(double * [3]) 是 将 double *hoge[3] 的 标识 符 去 掉 后 形成 的 ， 所 以 这 个 
类 型 名 被 解释 成 “指向 double 的 指针 的 数组 ”。 


社 
名 这 如 果 将 指针 后 置 …… 


C 的 声明 语法 虽然 奇怪 ,但 也 有 人 说 Pascal 风格 写 起 来 长 得 像 衰 脚 布 ， 
同样 让 人 感到 厌恶 。 
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*# C 中 ， 人 被 作为 异 或 运 
算 符 使 用 。 这 里 ， 我们 
且 不 必 去 关心 这 一 点 。 


* 另外 ,如 果 将 指针 的 强 
制 转型 也 进行 后 置 , 同 
样 也 能 起 到 简化 表达 
式 的 作用 。 


var 
hoge : array[0..9] of integer; 
关于 这 样 的 声明 ，array 后 面 紧 接 着 [] ， 用 来 表示 这 是 个 数组 ， 但 是 
这 样 让 人 感觉 array 这 个 单词 太 长 了 。 顺 手 在 后 面 追 加 的 of 也 是 多 余 的 。 
尝试 将 这 些 多 余 的 部 分 去 掉 ， 结 果 就 像 下 面 这 样 : 
var 
hoge : [0..9] integer; 
如 果 改 成 C 的 写法 : 
hoge[10] int; 


如 果 仅仅 就 int 前 置 还 是 后 置 的 问题 来 说 ， 感 党 和 C 的 声明 方式 也 没 
多 大 差别 。 

可 是 ， 一 旦 涉及 指针 ， 情 况 就 不 一 样 了 。C 的 指针 运算 符 * 是 前 置 的 。 

在 Pascal 中 ， 运 算 符 ^ 相 当 于 C 中 * 的 ， 而 且 它 是 后 置 的 。 

如 果 同 样 地 将 C 的 指针 运算 符 * 也 放 在 标识 符 后 面 ， 即 使 兼顾 “变量 的 
声明 仿效 表达 式 的 语法 ”， 声 明 也 会 变 成 下 面 这 样 : 

int func_pACdouble) ; 


如 果 这 个 声明 表示 “指向 返回 int 的 函数 ( 参数 为 double ) 的 指针 ”， 
差不多 也 符合 英语 的 阅读 顺序 。 不 过 int 放 在 前 面 终究 是 个 问题 。 
此 外 ， 一旦 使 用 后 置 的 和 ， 通 过 指针 引用 结构 体 的 成 员 的 时 候 ， 就 可 


以 不 要 -> 运算 符 了 。 
原本 


hoge->piyo 
只 是 
(x*hoge) .piyo 
的 语法 糖 ， 所 以 又 可 以 写成 
hoge^ .piyo 
因此 -> 完全 可 以 不 要 的 。 
此 外 ,将 解 引 用 后 置 ， 可 以 使 包含 结构 体 成 员 和 数组 引用 的 复杂 表达 
式 变 得 简洁 。 
关于 这 一 点 ,“The Development ofthe C LanguageD ”中 也 有 说 明 : 


Sethi [Sethi 81] observed that many of the nested declarations and 
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expressions would become simpler ifthe Indirection operator had been 
taken as a postfix operator instead of prefix, but by then it was too late 
to change. 


请 允许 我 用 我 这 二 把 刀 的 英语 水 平 给 大 家 翻译 一 下 : 


Sethi 认为 ， 如 果 将 解 引用 由 前 置 变 成 后 置 ， 嵌 套 的 声明 和 
表达 式 就 会 变 得 更 简单 。 但 是 ， 如 今 想 要 修正 ， 为 时 已 晚 。 














3.2 “C 的 数据 类 型 的 模型 
3.2.1 基本 类 型 和 派生 类 型 


假设 有 下 面 这 样 的 声明 : 
int (x*func_table[10])(int a); 
根据 上 节 中 介绍 的 方法 ， 可 以 解释 成 : 


指向 返回 int 的 函数 (参数 为 int a ) 的 指针 的 数组 (元素 个 
数 10 ) 




















如 果 面 成 图 ， 可 以 用 这 样 的 链 结构 "来 表示 : 











参数 为 int 元 素 个 数 10 


图 3-1 用 图 表现 “类 型 ” 
这 种 表示 ， 在 本 书 中 称 为 “类 型 链 的 表示 ”。 
姑且 先 忽视 结 构 体 、 共 用 体 、typedef 等 类 型 ， 概 要 地 进行 说 明 ， 链 的 



























































最 后 面 的 元 素 是 基本 类 型 ， 这 里 可 能 是 int 或 者 double。 * 如 果 按 照 日 语 的 语 
一 NE 序 ， 应 该 是 最 前 面 的 
此 外 ， 从 倒数 第 2 个 元 素 开 始 的 元 素 都 是 派生 类 型 。 所 谓 “ 派 生 类 型 "， 元 

















就 是 指 从 某 些 类 型 派生 出 来 的 类 型 。 

















Q@ 由 于 日 语 和 中 文 语序 的 差异 ， 图 中 日 文 原 书 的 箭头 和 本 书 相反 。-- 译 者 注 
@ 译本 采用 中 文 的 语序 。 一 译 者 注 
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除了 结构 体 、 共 用 体 之 外 ,还 有 以 下 3 种 派生 类 型 


口 指针 
口 数组 (“元素 个 数 ” 作 为 它 的 属性 ) 
口 函数 (参数 信息 作为 它 的 属性 ) 


关于 派生 类 型 ，K&R 中 有 这 样 一 段 描 述 (p.239 ): 


除 基 本 的 算术 类 型 以 外 ， 利 用 以 下 的 方法 可 以 生成 概念 上 无 限 
种 类 的 派生 类 型 。 
口 给 出 类 型 的 对 象 的 数组 
口 返回 给 出 类 型 的 对 象 的 函数 
口 指向 给 出 类 型 的 对 象 的 指针 
口 包含 各 种 一 系列 对 象 的 结构 体 
口 能 够 包含 各 种 类 型 的 数 个 对 象 中 的 任意 一 个 共用 体 


一 般 来 说 ， 这 些 对 象 的 生成 方法 可 以 递归 使 用 。 


可 能 大 家 完全 不 明白 这 段 描述 在 说 什么 。 其 实 归纳 一 下 ， 可 以 表述 成 下 
* 实际 上 ,派生 还 有 其 他 ” 面 这 句 话 ”， 
几 个 限制 ,关于 这 些 我 
们 在 后 面 介绍 。 从 基本 类 型 开始 ， 递 归 地 (重复 地 ) 粘 附 上 派生 类 型 ， 就 可 以 
生成 无 限 类 型 。 


通过 如 图 3-1 的 方式 将 链 不 断 地 接 长 ， 就 可 以 不 断 生成 新 的 “类 型 ”。 


另外 , 在 链 中 , 最 后 的 类 型 ( 数组 (元 素 10) ) 整合 了 全 体 类 型 的 意义 ,所 
以 我 们 将 最 后 的 类 型 称 为 类 型 分 类 。 

比如 , 无论 是 “指向 int 的 指针 ”, 还 是 “指向 double 的 指针 ”, 结果 都 
是 “指针 ”; 无 论 是 “int 的 数组 ”"， 还 是 “指向 char 的 指针 的 数组 ”， 结 果 
都 是 “数组 ”。 





















































3.2.2 ”指针 类 型 派生 
在 1.2.1 节 中 ， 引 用 了 标准 中 的 一 节 ， 在 此 ， 请 允许 我 再 次 引用 。 


指针 类 型 (pointer type ) 可 由 函数 类 型 、 对 象 类 型 或 不 完全 的 类 
型 派生 ， 派 生 指针 类 型 的 类 型 称 为 引用 类 型 。 指 针 类 型 描述 一 个 对 
象 ， 该 类 对 象 的 值 提供 对 该 引用 类 型 实体 的 引用 。 由 引用 类 型 T 派 
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生 的 指针 类 型 有 时 称 为 “( 指向 )T 的 指针 ”。 从 引用 类 型 构造 指针 类 
型 的 过 程 称 为 “指针 类 型 的 派生 ”。 这 些 构造 派生 类 型 的 方法 可 以 北 
归 地 应 用 。 


“由 引用 类 型 派生 的 指针 类 型 有 时 称 为 “( 指向 ) 工 的 指针 ”这 人 句 话 ， 
可 以 在 图 3-2 中 用 链 来 表现 。 








这 里 的 全 体 元 素 为 被 引用 类 型 T 
| 


| | 
指向 
EE | 


图 3-2 ”指针 类 型 派生 











对 于 指针 类 型 来 说 ， 因 为 它 指向 的 类 型 各 不 相同 ， 所 以 都 是 从 既 存 的 类 
型 派生 出 “指向 工 的 指针 ”这 样 的 类 型 。 


大 多 数 处 理 环境 中 的 指针 ， 在 实现 上 都 只 是 单纯 的 地 址 ， 所 以 无 论 从 什 
么 类 型 派生 出 的 指针 , 在 运行 时 的 状态 都 是 大 体 相同 的 "。 但 是 , 加 上 * 运 算 符 ”* 前 面 也 曾经 提 到 ,如 果 
求 值 的 时 候 ， 以 及 对 指针 进行 加 法 运算 的 时 候 ， 由 不 同类 型 派生 出 来 的 指针 。 解释 得 详细 一 些 , 对 于 


司 训 闪 异 ， 指向 char 的 指针 和 指 
之 间 就 存在 差异 向 int 的 指针 ， 偶 尔 


前 面 已 经 提 到 ， 如 果 对 指针 进行 加 法 运算 ,指针 只 前 进 指针 所 指向 类 型 。 存在 位 数 不 相 同 的 处 
的 大 小 的 距离 。 这 一 点 对 于 后 面 的 说 明 有 着 非常 重要 的 意义 。 理 环境 。 


可 以 使 用 图 3-3 来 解释 指针 类 型 。 



































指向 T 的 指针 
加 1 指 3 
向 这 里 














图 3-3 ”指针 类 型 的 图 解 


3.2.3 ”数组 类 型 派生 


和 指针 类 型 相同 ， 数 组 类 型 也 是 从 其 元 素 的 类 型 派生 出 来 的 。“ 元 素 个 
数 ” 作 为 类 型 的 属性 添加 在 类 型 后 面 ( 参照 图 3-4 )。 
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这 里 的 全 体 为 元 素 类 型 
| 








图 3-4 数组 类 型 派生 


























数组 类 型 本 质 就 是 将 一 定 个 数 的 派生 源 的 类 型 进行 排列 而 得 到 的 类 型 。 如 
3-5 所 示 。 


派生 源 的 类 型 T 





| 工 的 数组 
(元 素 个 数 5) 








图 3-5 数组 行 的 图 解 


3.2.4 ”什么 是 指向 数组 的 指针 


“数组 ”和 “指针 ”都 是 派生 类 型 。 它 们 都 是 由 基本 类 型 开始 重复 派生 生 
成 的 。 


也 就 是 说 ,， 派 生出“ 数组” 之后， 再 派生 出 “指针 ”， 就 可 以 生成 “ 指 癌 
数组 的 指针 ”。 


一 听 到 “指向 数组 的 指针 ”， 有 人 也 许 要 说 : 
这 不 是 很 简单 嘛 , 数组 名 后 不 加 口 , 不 就 是 “指向 数组 的 指针 ” 吗 ? 


抱 有 这 个 想法 的 人 ,请 将 1.3 节 的 内 容重 新 阅读 一 下 ! 的 确 ， 在 表达 式 中 ， 数 
组 可 以 被 解读 成 指针 。 但 是 ， 这 不 是 “指向 数组 的 指针 ”， 而 是 “指向 数组 初 
元 素 的 指针 ”。 


实际 地 声明 一 个 “指向 数组 的 指针 ”， 
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int (x*array_p)[3]; 
array_p 是 指向 int 数组 (元素 个 数 3) 的 指针 。 


根据 ANSIC 的 定义 ， 在 数组 前 加 上 &， 可 以 取得 “指向 数组 的 指针 ”“。  ”* 这 里 是 “数组 可 以 解读 
因此 成 指向 它 初始 元 素 的 
指针 ”这 个 规则 的 一 个 
War ay 例外 (参照 3.3.3 节 )。 
int (x*array_p)[3]; 
array_p = &array; 一 一 数组 添加 &， 取 得 “指向 数组 的 指针 ” 
这 样 的 赋值 是 没有 问题 的 ， 因 为 类 型 相同 。 


可 是 ， 如 果 进 行 

















array_p = array; 
这 样 的 赋值 ， 编 译 吉 就 会 报 出 警告 。 


“指向 int 的 指针 ”和 “指向 int 的 数组 ( 元素 个 数 3 ) 的 指针 ”是 完全 
不 同 的 数据 类 型 。 


但 是 ， 从 地 址 的 角度 来 看 ，array 和 &array 也 许 就 是 指向 同一 地 址 。 但 
要 说 起 它们 的 不 同 之 处 ， 那 就 是 它们 在 做 指针 运算 时 结果 不 同 。 


在 我 的 机 器 上 ， 因 为 int 类 型 的 长 度 是 4 个 字 节 ， 所 以 给 “指向 int 的 
指针 ”加 1， 指 针 前 进 4 个 字 节 。 但 对 于 “指向 int 的 数组 〈 元素 个 数 3 ) 的 
指针 ”， 这 个 指针 指向 的 类 型 为 “int 的 数组 (元素 个 数 3 ， 当 前 数组 的 尺 
寸 为 12 个 字 节 (如 果 int 的 长 度 为 4 个 字 节 )， 因此 给 这 个 指针 加 1， 指 针 就 
前 进 12 个 字 节 (人 参照 图 3-6 )。 

























































































指向 T 的 指针 


加 1 后 ， 指 5 
针 指 向 这 里 


3-6 对 “指向 数组 的 指针 ”进行 加 法 运算 


int 的 数组 
(元 素 个 数 3) 




















道理 我 明白 了 ， 但 是 一 般 没 有 人 这 么 用 吧 ? 


可 能 有 人 存在 以 上 的 想法 。 但 真 的 有 很 多 人 就 是 这 么 用 的 ， 只 不 过 是 自 
己 没 有 意识 到 。 为 什么 这 么 说 呢 ? 在 后 面 的 章节 中 将 会 说 明 。 
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* 在 C 标 准 中 ,“ 多 维 数 
组 ”这 个 词 最 初出 现在 
脚注 中 ,之 后 这 个 词 也 
会 不 时 地 出 现在 各 个 
角落 。 尽 管 “ 不 存在 多 
维 数组 ”这 个 观点 会 让 
人 感觉 有 些 极端 , 但 如 
果 你 不 接受 这 个 观点 ， 
对 于 C 的 类 型 模型 的 
理解 ,可 能 就 会 比较 困 
难 。 





3.2.5 C 语言 中 不 存在 多 维 数组 ! 
在 C 中 ， 可 以 通过 下 面 的 方式 声明 一 个 多 维 数 组 : 
int hoge[3] [2]; 


我 想 企图 这 么 干 的 人 应 该 很 多 。 请 大 家 回忆 一 下 C 的 声明 的 解读 方法 ， 
上 面 的 声明 应 该 怎样 解读 呢 ? 


是 “int 类 型 的 多 维 数组 ” 吗 ? 
这 是 不 对 的 。 应 该 是 “int 的 数组 ( 元素 个 数 2 ) 的 数组 ( 元 素 个 数 3 了 了。 
也 就 是 说 ， 即 使 C 中 存在 “数组 的 数组 ”， 也 不 存在 多 维 数组 。 


“数组 ”就 是 将 一 定 个 数 的 类 型 进行 排列 而 得 到 的 类 型 。 数组 的 数组 ” 
也 只 不 过 是 派生 源 的 类 型 恰好 为 数组 。 图 3-7 是 “int 的 数组 〈 元 素 个 数 2 ) 
的 数组 (元 素 个 数 3 )》。 





























向 “】 int 的 数组 
厂 ( 素 和 2) 





int 的 数组 (元 
素 个 数 2) 的 数 
组 (元 素 个 数 3) 








1nt 


图 3-7 数组 的 数组 





要 点 
C 语言 中 不 存在 多 维 数组 。 
看 上 去 像 多 维 数组 ， 其 实 是 “数组 的 数组 ”。 


对 于 下 面 的 这 个 声明 : 


int hoge[3] [2]; 


可 以 通过 hoge[i] [j] 的 方式 去 访问 ， 此 时 ，hoge[i] 是 指 “int 的 数组 
( 元素 个 数 2 ) 的 数组 (元 素 个 数 3 ”中 的 第 i 个 元 素 ， 其 类 型 为 “int 数组 
(元 素 个 数 2 ”。 当 然 ， 因 为 是 在 表达 式 中 ， 所 以 在 此 时 此 刻 ，hoge[i 让 也 可 
以 被 解读 成 “指向 int 的 指针 ”。 


关于 这 一 点 ，3.3.5 节 中 会 有 更 详细 的 说 明 。 

















3.2 C 的 数据 类 型 的 模型 


117 





那么 ， 如 果 将 这 个 “ 伪 多 维 数组 ”作为 函数 的 参数 进行 传递 ， 会 发 生 什 
么 呢 ? 


试图 将 “int 的 数组 ”作为 参数 传递 给 函数 ， 其 实 可 以 直接 传递 “指向 
int 的 指针 ”。 这 是 因为 在 表达 式 中 ， 数 组 可 以 解释 成 指针 。 


因此 , 在 将 “int 的 数组 ”作为 参数 传递 的 时 候 , 对 应 的 函数 的 原型 如 下 : 
void func(int *hoge); 


在 “int 的 数组 (元 素 个 数 2 ) 的 数组 (元 素 个 数 3) 的 情况 下 ,假设 使 
用 同样 的 方式 来 考虑 ， 


int 的 数组 元 素 个 数 2) 的 数组 (元 素 个 数 3) 
其 中 下 划 线 部 分 ， 在 表达 式 中 可 以 解释 成 指针 ， 所 以 可 以 向 函数 传递 
指向 int 的 数组 (元 素 个 数 2) 的 指针 

这 样 的 参数 ,说白 了 它 就 是 “指向 数组 的 指针 ”。 
也 就 是 说 ， 接 收 这 个 参数 的 函数 的 原型 为 : 
void funcCint (*hoge) [2]); 

直到 现在 ， 有 很 多 人 将 这 个 函数 原型 写成 下 面 这 样 : 
void funcCint hoge[3][2]); 

或 者 这 样 : 
void funcCint hoge[] [2]); 

其 实 ， 



































void func(int (*hoge) [2]); 
就 是 以 上 两 种 写法 的 语法 糖 ， 它 和 上 面 两 种 写法 完全 相同 。 


关于 将 数组 作为 参数 进行 传递 这 种 的 情况 下 的 语法 糖 ， 在 3.5.1 节 中 会 再 
一 次 进行 说 明 。 






































3.2.6 ”上 项 数 类 型 派生 


函数 类 型 也 是 一 种 派生 类 型 , “参数 (类 型 是 它 的 属性 。 
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此 处 全 体 是 返回 值 的 类 型 
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图 3-8 ”函数 类 型 派生 








可 是 ， 函 数 类 型 和 其 他 派生 类 型 有 不 太 相 同 的 一 面 。 


无 论 是 int 还 是 double， 亦 或 数组 、 指 针 、 结 构 体 ， 只 要 是 函数 以 外 的 
类 型 ， 大 体 都 可 以 作为 变量 被 定义 。 而 且 ， 这 些 变量 在 内 存 占用 一 定 的 空间 。 
因此 ， 通 过 sizeof 运算 符 可 以 取得 它们 的 大 小 。 


像 这 样 ， 有 特定 长 度 的 类 型 ， 在 标准 中 称 为 对 象 类 型 。 


可 是 ， 函 数 类 型 不 是 对 象 类 型 。 因 为 函数 没有 特定 长 度 。 所 以 C 中 不 存 
在 “函数 类 型 的 变量 ”( 其 实 也 没有 必要 存在 )。 


数组 类 型 就 是 将 几 个 派生 类 型 排列 而 成 的 类 型 。 因 此 ， 数 组 类 型 的 全 体 
长 度 为 : 
派生 源 的 类 型 的 大 小 X 数 组 的 元 素 个 数 


可 是 ， 消 数 类 型 是 无 法 得 到 特定 长 度 的 ， 所 以 从 函数 类 型 派生 出 数组 类 
型 是 不 可 能 的 。 也 就 是 说 ， 不 可 能 出 现 “函数 的 数组 ”这 样 的 类 型 。 


可 以 有 “指向 函数 的 指针 ”类 型 ， 但 不 幸 的 是 ， 对 指向 函数 类 型 的 指针 
不 能 做 指针 运算 ， 因 为 我 们 无 法 得 到 当前 指针 类 型 的 大 小 。 


此 外 ， 函 数 类 型 也 不 能 成 为 结构 体 和 共用 体 的 成 员 。 
总 而 言 之 : 
从 函数 类 型 是 不 能 派生 出 除了 指针 类 型 之 外 的 其 他 任何 类 型 的 。 
不 过 “指向 函数 的 指针 类 型 ”， 可 以 组 合成 指针 或 者 作为 结构 体 、 共 用 体 的 
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成 员 。 毕 竞 “ 指 向 函数 的 指针 类 型 ”也 是 指针 类 型 ， 而 指针 类 型 又 是 对 象 
类 型 。 

另外 ， 函 数 类 型 也 不 可 以 从 数组 类 型 派生 。 

可 以 通过 “返回 ~ 的 函数 ”的 方式 派生 出 函数 类 型 不 过 在 C 中 ， 数 组 
是 不 能 作为 函数 返回 值 返回 的 (参照 1.1.8 节 )。 

要 点 


从 函数 类 型 是 不 能 派生 出 除了 指针 类 型 之 外 的 其 他 任何 类 型 的 。 
从 数组 类 型 是 不 能 派生 出 函数 类 型 的 。 
3.2.7 计算 类 型 的 大 小 
除了 函数 类 型 和 不 完全 类 型 (参照 3.2.10 节 )， 其 他 类 型 都 有 大 小 。 
通过 
sizeof( 类 型 名 ) 
编译 器 可 以 为 我 们 计算 当前 类 型 的 大 小 ， 无 论 是 多 么 复杂 的 类 型 。 
printf("size..%d\n", sizeof(int(x[5]) (double))); 
以 上 的 语句 表示 输出 
指向 返回 int 的 函数 (参数 为 double) 的 指针 的 数组 (元 素 个 数 5) 的 大 小 。 


在 这 里 顺便 对 以 前 的 内 容 也 做 一 下 复习 : 模仿 编译 器 的 处 理 方式 ， 尝 试 
计算 各 种 类 型 的 大 小 。 


另外 ， 我 们 考虑 使 用 如 下 构成 的 机 器 来 作为 处 理 环境 。 









































int 4 个 字 节 
double ”8 个 字 节 
指针 4 个 字 节 


【注意 ! 】 

在 这 里 我 们 为 了 说 明 方便 ， 特 别 地 对 处 理 环境 做 了 假定 。 但 是 ， 
C 语 言 的 标准 并 没有 对 int、double 和 指针 的 大 小 进行 任何 规定 ， 
数据 类 型 的 大 小 完全 取决 于 各 处 理 环境 的 具体 实现 。 

因此 ， 我 们 通常 不 需要 去 留意 数据 类 型 的 物理 大 小 ， 更 不 应 该 
依赖 数据 类 型 大 小 进行 编程 。 
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可 以 像 下 面 这 样 ， 以 日 语 " 词 组 的 顺序 计算 类 型 的 大 小 : 
@ 基本 类 型 

基本 类 型 必定 依赖 处 理 环境 进行 计算 。 

@ 指针 





首 针 的 大 小 是 依赖 处 理 环 境 决 定 的 。 大 部 分 情况 下 ， 指 针 的 大 小 和 派生 
源 的 大 小 没有 关系 ， 它 的 大 小 是 固定 的 。 





日 数组 

数组 的 大 小 可 以 通过 派生 源 类 型 的 大 小 乘 以 元 素 个 数 得 到 。 
@ 函数 

函数 的 大 小 无 法 计算 。 





现在 ， 可 以 尝试 计算 刚才 的 示例 。 
指向 返回 int 的 函数 〈 人 参数 为 double) 的 指针 的 数组 〈 元 素 个 数 5) 


的 大 小 。 


@ 指向 返回 int 的 函数 (参数 为 double) 的 指针 的 数组 (元素 个 数 5)。 
因为 是 int 类 型 ， 所 以 在 当前 假定 的 处 理 环境 中 , 计算 结果 为 4 个 
字 节 。 

@ 指向 返回 int 的 函数 (参数 为 double) 的 指针 的 数组 (元 素 个 数 5)。 
因为 是 函数 ， 所 以 无 法 计算 大 小 。 

@ 指向 返回 int 的 函数 (参数 为 double) 的 指针 的 数组 (元 素 个 数 
因为 是 指针 , 所 以 在 当前 假定 的 处 理 环境 中 , 计算 结果 为 4 个 字 

@ 指向 返回 int 的 函数 (参数 为 double) 的 指针 的 数组 (元 素 个 数 sy 
因为 是 派生 源 的 大 小 为 4 的 “元 素 个 数 为 5 的 数组 "”， 所 以 计算 结 
果 为 4x5=20 个 字 节 。 


同样 地 ， 表 3-3 中 整理 了 对 各 种 类 型 的 大 小 进行 计算 的 结果 。 














GD 这 里 同样 可 以 用 中 文 词组 的 顺序 来 计算 。 一 一 译 者 注 
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表 3-3 ”计算 各 种 类 型 的 大 小 





声 明 中 文 的 表现 大 小 
int hoge; hoge 是 int 4 个 字 节 
int hoge[10] hoge 是 int 的 数组 4 x 10=40 个 字 节 


int x*hoge[10]; 
double *hoge[10] 
int hoge[2][3]; 


hoge 是 int 的 指针 的 数组 〈 元 素 个 数 10 ) 
hoge 是 doub1e 的 指针 的 数组 〈 元 素 个 数 10 ) 
hoge 是 int 的 数组 〈 元素 个 数 3 ) 的 数组 (元 


素 个 数 2 ) 


3.2.8 ”基本 类 型 

















派生 类 型 的 底层 是 基本 类 型 。 


基本 类 型 指 ，char 和 int 这 样 的 整 型 以 及 float 和 double 这 样 的 ; 








型 。 这 些 类 型 加 上 枚 举 类 型 ， 统 称 为 算术 型 。 


此 外 , 在 C 中 ,通过 short int 声明 一 个 变量 ， 和 生 
意义 是 完全 一 样 的 。 


对 于 整 型 和 浮 ， 


明 一 个 变量 ， 





推 “和 荐 





型 ， 怎 样 的 写法 是 允许 的 ， 哪 种 写法 和 哪 种 写法 的 意义 
是 相同 的 ， 这 些 内 容 非常 琐碎 ， 特 整理 如 下 《〈 表 3-4 )。 








表 3-4 ”整数 型 、 浮 点 型 的 种 类 





4x 10=40 个 字 节 





4x 10=40 个 字 节 


4x3 x2=24 个 字 节 


da 


和 纯 地 通过 short 声 





char 


signed char 


unsigned char 


short 


unsigned short 


int 


unsigned int 


long 


unsigned long 


float 
double 


long double 


char 和 signed char 或 者 unsigned char 同 义 。 至 于 默认 情况 下 , char 





signed short, short int, signed short int 


unsigned short int 


signed，signed int， 无 指定 类 型 


unsigned 


signed long, long int, signed long int 


unsigned long int 





沾 





葛 是 有 符号 的 还 是 无 符号 的 ，C 标准 并 没有 定义 ， 而 是 取决 于 处 理 环境 。 


# 在 标准 中 ， 枚 举 类 型 没 
有 包括 在 基本 类 型 
( basic type ) 中 ( 6.1.2.5 )。 
在 K&R 中， 它们 被 混 
在 一 起 了 。 
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根据 处 理 环 境 不 同 ，1ong 1ong 等 写法 有 可 能 也 是 允许 的 ， 这些 都 不 在 标 
准 的 约束 范围 之 内 。ANSI C 以 前 的 C， 存 在 1ong float 这 样 的 写法 ， 它 和 
double 同 义 ， 但 是 在 ANSIC 之 后 这 种 写法 就 被 废弃 了 。 


另外 ,对 于 这 些 类 型 的 大 小 ，sizeof(char) (包含 signed、unsigned ) 
必定 返回 1。 其 他 的 类 型 全 部 依赖 处 理 环境 的 定义 。 即 使 是 char, 在 sizeof 
肯定 会 返回 1 的 情况 下 ， 也 没有 规定 肯定 是 8 位 , 现实 中 也 存在 char 为 9 的 
处 理 环 境 。 


偶尔 有 一 些 不 靠 谱 的 C 语言 人 门 书籍 会 跟 大 家 乱 嚼 舌头 :“int 的 大 小 是 
依赖 于 硬件 的 ,所 以 尽量 不 要 使 用 int。” 这 种 观点 完全 是 错误 的 ,不 只 是 int， 
无 论 是 short 还 是 1ong , 它们 的 大 小 都 依赖 于 处 理 环 境 。 具有 讽刺 意味 的 是 ， 
几乎 所 有 持 有 这 种 观点 的 入 门 书 的 例 程 也 在 使 用 int。 言 行 不 一 ”说话 不 算 
数 ? 哎 ， 我 都 不 知道 该 怎么 说 了 .……: 


不 过 标准 还 是 规定 了 每 种 类 型 可 以 表示 的 值 的 范围 : 




































































口 有 符号 char，+ 127 

口 无 符号 char，0 ~ 255 

口 有 符号 int， 有 符号 short，+ 32767 

口 无 符号 int，unsigned short, 0~65535 
口 有 符号 10ng，+ 2147483647 

口 无 符号 1ong，0 ~ 4294967295 


请 注意 在 这 里 有 符号 int 的 最 小 值 不 是 -32768， 这 是 因为 考虑 到 有 的 机 
器 对 于 负数 使 用 1 的 补 码 "。 


3.2.9 结构 体 和 共用 体 


在 语法 上 ， 结 构 体 和 共用 体 是 作为 派生 类 型 使 用 的 。 
可 是 直到 现在 ， 我 们 还 没有 专门 去 说 明 结 构 体 和 共用 体 。 其 理由 如 下 : 


然 结构 体 和 共用 体 在 语法 上 属于 派生 类 型 ， 但 是 在 声明 中 它 和 数据 

< 型 修饰 符 ( 也 就 是 int 、double 等 ) 处 于 相同 的 位 置 。 

口 只 有 派生 指针 、 数 组 和 函数 的 时 候 ， 类 型 才 可 以 通过 一 维 链表 表示 。 
结构 体 、 共 用 体 派 生 类 型 只 能 用 树 结构 进行 表现 。 
































口 














日 闫 却 











/ 























@ 对 于 有 符号 的 int 值 ， 原 码 的 范围 为 -32767/1111111111111111 ~ +32767/0111111111111111， 
补 码 的 范围 为 -32768/1000000000000000 ~ +32767/0111111111111111。 一 一 译 者 注 
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结构 体 类 型 可 以 集合 几 个 其 他 不 同 的 类 型 ， 而 数组 只 能 线性 地 包含 同一 


个 类 型 。 














共用 体 的 语法 和 结构 体 相 似 ， 但 是 ， 结 构 体 的 成 员 是 “排列 地 ”分 配 在 
内 存 中 ， 而 共用 体 的 成 员 则 是 “ 重 县 地 ”分 配 在 内 存 中 。 在 第 5 章 将 会 介绍 
共用 体 的 用 途 。 




















让 我 们 通过 图 3-9， 尝 试 使 用 “类 型 链 的 方式 ”来 表现 结构 体 和 共用 体 的 


各 种 各 样 的 类 型 


L 包含 这 些 类 型 
| Ce 
i 


图 3-9 ”结构 体 类 型 的 派生 





3.2.10 ”不 完全 类 型 
不 完全 类 型 指 “ 函 数 之 外 、 类 型 的 大 小 不 能 被 确定 的 类 型 ”。 
总 结 一 下 ，C 的 类 型 分 为 : 


口 对 象 类 型 (char、int、 数 组 、 指 针 、 结 构 体 等 ) 
口 兄 数 类 型 
口 不 完全 类 型 











结构 体 标记 的 声明 就 是 一 个 不 完全 类 型 的 典型 例子 。 








对 于 男性 ( Man )， 他 可 能 有 妻子 (wife )。 如 果 是 未 婚 男 性 ，wife 就 是 
NULL。 所 以 ，Man 这 样 的 类 型 ， 可 以 声明 成 下 面 这 样 : 








struct Man_tag { 


struct Woman_tag *wife; //* 妻 */ 
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作为 妻子 ， 可 以 这 样 声明 : 


struct Woman_tag { 
struct Man_tag *husband; /* 夫 */ 


es 

这 种 情况 下 ，struct Man_tag 和 struct Woman_tag 是 相互 引用 的 ， 
所 以 无 论 先 声明 哪 一 边 都 很 麻烦 。 

可 以 像 下 面 这 样 通过 先 声 明 结构 体 标记 来 回避 以 上 问题 : 


struct Woman_tag; 一 一 ”将 tag 提前 声明 








struct Man_tag { 
struct Woman_tag *wife; /* 妻 */ 


}; 


struct Woman_tag { 


struct Man_tag *husband; /* 夫 */ 





}; 
在 我 的 环境 中 ， 结 构 体 必须 使 用 typedef， 所 以 ， 
typedef struct Woman_tag Woman 一 一 ”提前 对 tag 进行 类 型 定义 


typedef struct { 
Woman x*wife; /* 妻 */ 


} Man; 


struct Woman_tag { 


Man x*husband; /* 夫 */ 
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对 这 种 情况 ， 在 Woman 类 型 的 标记 被 声明 的 时 候 ， 还 不 知道 其 内 容 ， 所 以 无 
法 确定 它 的 大 小 。 这 样 的 类 型 就 称 为 不 完全 类 型 。 


因为 不 能 确定 大 小 ， 所 以 不 能 将 不 完全 类 型 变 成 数组 ， 也 不 能 将 其 
为 结构 体 的 成 员 ， 或 者 声明 为 变量 。 但 如 果 仅 仅 是 用 于 取得 指针 ， 是 可 以 
使 用 不 完全 类 型 的 。 上 面 的 结构 体 Man ， 就 是 将 Woman 类 型 的 指针 作为 它 
的 成 员 。 


之 后 ， 在 定义 struct Woman_tag 的 内 容 的 时 候 ，Woman 就 不 是 不 完全 
类 型 了 。 


在 C 标 准 中 ，void 类 型 也 被 归 类 为 不 完全 类 型 。 


3.3 ”表达 式 


3.3.1 表达 式 和 数据 类 型 

直到 现在 ， 我 们 没有 进行 明确 地 定义 就 使 用 了 表达 式 ( expression ) 这 
个 词 。 

首先 介绍 基本 表达 式 (primary expression )， 基 本 表达 式 是 指 : 
口 标识 符 〈 变 量 名 、 函 数 名 ) 
口 常量 ( 包括 整数 常量 和 浮 点 数 常量 
口 字符 串 常 量 (使 用 “” 括 起 来 的 字符 串 ) 
口 使 用 QO， 插 起 来 的 表示 式 

此 外 , 对 表达 式 使 用 运算 符 , 或 通过 运算 符 将 表达 式 和 表达 式 相互 连接 ， 
这 些 表示 方法 也 称 为 表达 式 。 

也 就 是 说 ,“5”“hoge” 都 是 表达 式 ( 如 果 已 经 声明 了 以 hoge 作为 名 称 
的 变量 )。 此 外 ,“5 + hoge” 也 是 表达 式 。 

对 于 下 面 的 表达 式 ， 

a+bx3/(4+C) 


它 可 以 表现 成 如 图 3-10 这 样 的 树 结构 ， 这 个 树 结构 的 所 有 部 分 的 树 "都 是 表 * 这 里 指 某 个 特定 节点 
达 式 。 以 下 的 树 。 
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仅仅 是 这 里 的 一 个 节点 ， 也 是 表达 式 


这 里 也 是 表达 式 
| 这 里 也 是 表达 式 








图 3-10 表达 式 的 树 结 构 


此 外 ， 所 有 的 表达 式 都 持 有 类 型 。 


3.2 节 中 介绍 了 可 以 通过 链 的 结构 表现 类 型 。 如 果 所 有 的 表达 式 都 持 有 类 
型 , 那么 对 于 表现 表达 式 的 树 结构 的 节点 , 都 可 以 被 挂 接 上 表现 类 型 的 链 ( 参 
照 图 3-11 )。 















































节点 表现 类 型 的 链 


人 


LL 





图 3-11 所 有 的 表达 式 都 持 有 类 型 


在 对 表达 式 使 用 运算 符 ， 或 者 将 表达 式 作为 参数 传递 给 函数 的 时 候 ， 表 
达 式 中 持 有 的 类 型 具有 特别 重要 的 意义 。 
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比如 ， 对 于 下 面 这 样 的 数组 : 
char str[256]; 
在 输出 这 个 字符 数组 的 内 容 的 时 候 ,， 使 用 
printf(str); 
初学 者 看 到 这 段 程序 ， 难 免 会 想 :“printf() 能 这 么 写 吗 ? ” 
确实 ， 就 像 这 个 世上 最 有 名 的 程序 中 写 的 这 样 : 
printf(C"hello, world\n"); 
第 1 个 参数 总 是 传递 字符 串 常量 。 
可 是 , 在 stdioh 的 原型 声明 中 ，printf() 的 第 1 参数 被 定义 为 “指向 char 
指针 ”。 
字符 串 常量 的 类 型 为 “char 的 数组 ”, 因为 是 在 表达 式 中 , 所 以 它 也 可 以 
当成 “指向 char 的 指针 ”。 因此 , 字符 串 常 量 可 以 传递 给 printf()。 同样 地 ， 
str 是 “char 的 数组 ”， 因 为 是 在 表达 式 中 ， 所 以 也 可 以 当成 “指向 char 的 
指针 ”， 能 够 传递 给 printfQ) 也 是 很 自然 的 事 。 
如 有 果 只 是 单纯 地 输出 字符 串 ， 对 于 字符 串 中 包含 % 感 到 麻烦 ， 与 其 使 用 
printf("%s", str); 
不 如 使 用 puts 会 更 好 。 这 个 就 扯 远 了 。 
此 外 ， 下 面 的 写法 也 许 会 让 某 些 人 感到 惊奇 : 
"01234567890ABCDEF" [index] 
但 如 果 写 成 这 样 : 
str[index] 


谁 都 不 会 觉得 奇怪 了 吧 。 在 表达 式 中 ，str 和 字符 串 常量 都 属于 “指向 char 
































的 指针 "， 它 们 都 可 以 作为 口 运 算 符 的 操作 数 "。 5 
中 运 界 付 作用 对 象 被 称 为 操作 
训 数 。 比 如 ，1 + 2 这 个 
六 NE 表达 式 , 1 和 2 是 运算 
Ty 充 针对 “表达 式 ” 使 用 sizeof 符 + 的 操作 数 。 


sizeof 运算 符 有 两 种 使 用 方法 。 
一 种 是 : 
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sizeof( 类 型 名 ) 

另外 一 种 是 : 

sizeof 表达 式 

后 者 能 够 返回 对 象 表达 式 的 类 型 的 大 小 。 

在 实际 开发 中 , “sizeof 表达 式 ” 这 种 使 用 方式 的 唯一 用 途 ， 就 是 从 
编译 器 获取 数组 的 长 度 。 

对 于 下 面 的 声明 ， 

int hoge[10]; 
在 sizeof(int) 为 4 的 处 理 环境 中 ， 

sizeof (hoge) 
返回 40。 因 此 将 这 个 结果 除 以 sizeof(int) 就 可 以 得 到 数组 元 素 的 个 数 。 

如 果 像 这 个 例子 这 样 显 式 地 指定 了 数组 的 大 小 ,即使 不 使 用 sizeof, 使 
用 #define 给 大 小 定义 一 个 合适 的 名 称 也 是 可 以 满足 需求 的 。 不 过 在 下 面 的 
情况 下 ,使 用 sizeof 也 许 更 加 方便 。 


char xcolor_name[] = { 
"black", 
"blue", 


}; 

#define COLOR_NUM (sizeof(color_name) / sizeof(char*)) 

在 这 种 情况 下 ， 由 于 使 用 了 数组 初始 化 表达 式 ， 这 里 可 以 省 略 定义 数 

* 参照 3.5.2 节 。 组 元 素 的 个 数 ', 因此 就 不 需要 使 用 #define 定义 一 个 固定 的 常量 了 。 另外 ， 

在 某 些 情况 下 需要 在 color_name 中 追加 更 多 的 元 素 ， 如 果 使 用 sizeof， 
只 需 修 改 程序 的 一 个 地 方 。 

无 论 怎样 ，sizeof 运算 符 只 是 向 编译 器 问 询 大 小 的 信息 ， 所 以 ， 它 只 
能 在 编译 器 明确 知道 对 象 大 小 的 情况 下 使 用 。 


extern int hoge[]; 


NS 


以 上 的 情况 是 不 能 使 用 sizeof 的 。 此 外 ， 


void func(int hoge[]) 
1 


} 


printf("%d\n", sizeof(hoge)); 
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这 样 的 程序 ， 也 只 是 输出 指针 的 长 度 (参照 3.5.1 节 )。 
也 许 很 多 人 并 不 知道 ， 对 于 “sizeof 表达 式 ”， 其 实 不 需要 括号 。 当 
然 ， 加 上 括号 也 可 以 ， 此 时 的 括号 只 是 单纯 地 起 到 括 起 操作 数 的 作用 。 
有 人 尽管 知道 这 一 点 ， 但 为 了 阅读 的 方便 ， 依 然 使 用 了 括号 。 


变量 的 两 张 面孔 





3.3.2 “ 左 值 ”是 什么 
假设 有 下 面 这 样 一 个 声明 : 
int hoge; 
因为 此 时 hoge 是 int 类 型 ， 所 以 ， 只 要 是 可 以 写 int 类 型 的 值 的 地 方 ， 
hoge 就 可 以 像 常量 一 样 使 用 。 


比如 ,将 5 赋予 hoge 之 后 ， 下 面 的 语句 























piyo = hoge * 10; 
理所当然 地 可 以 写成 





piyo = 5 * 10; 
但 是 , 在 

hoge = 10; 
的 情况 下 ， 即 使 此 时 hoge 的 值 为 5， 

5 = 10; 
这 样 的 置换 也 是 非法 的 。 

也 就 是 说 ， 作 为 变量 ， 它 有 作为 “自身 的 值 ”使 用 和 作为 “自身 的 内 存 
区 域 ”使 用 两 种 情况 。 

此 外 在 C 中 ， 即 使 不 是 变量 名 ， 表 达 式 也 可 以 代表 “ 某 个 变量 的 内 存 
域 "。 比 如 这 种 情况 : 


hoge_p = &hoge; 







































































Xl 





*hoge_p = 10; 一 一 *hoge_p 是 指 hoge 的 内 存 区 域 

像 这 样 ， 表 达 式 代表 某 人 处 的 内 存 区域 的 时 候 ， 我 们 称 当 前 的 表达 式 为 
左 值 (lvalue ); 相对 的 是 ， 表 达 式 只 是 代表 值 的 时 候 ， 我 们 称 当 前 的 表达 式 
为 右 值 。 
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表达 式 中 有 时 候 存 在 左 值 ， 有 时 候 不 存在 左 值 。 比 如 ,根据 上 下 文 ， 表 
达 式 可 以 作为 左 值 或 者 右 值 使 用 ,但 是 5 这 样 的 常量 ,或 者 1 + hoge 这 样 的 
表达 式 却 只 能 解释 成 右 值 。 




















人 补 
名 充 “ 左 值 ”这 个 词汇 的 由 来 


在 C 以 前 的 语言 中 ， 因 为 表达 式 在 赋值 的 左边 ， 所 以 表达 式 被 解释 成 
左 值 。“ 左 ”在 英语 中 是 left，left value 就 被 简写 成 lvalue。 

但 在 C 中 ，++hoge 这 样 写 法 也 是 合法 的 ， 此 时 hoge 是 指 某 处 的 内 存 
区 域 ， 但 是 怎么 看 也 看 不 出 “左边 ”的 意思 。 因 此 ， 左 值 这 个 词 真 有 点 让 
人 摸 不 着 头脑 。 

在 标准 委员 会 的 定义 中 , lvalue 的 1 不 是 left 的 意思 , 而 表示 locator( 指 
示 位 置 的 事物 )。Rationale 中 有 下 面 一 段 描述 ， 


The Committee has adopted the definition of lvalue as an object locator. 


尽管 如 此 ，JIS X3010 还 是 将 lvalue 解释 成 了 “ 左 值 ”。 了 


3.3.3 ”将 数组 解读 成 指针 
正如 在 前 面 翻 来 覆 去 提 到 的 那样 ， 在 表达 式 中 ， 数 组 可 以 解读 成 指针 。 
int hoge[10] ; 

以 上 的 声明 中 ，hoge 等 同 于 &hoge[0]。 


hoge 原本 的 类 型 为 “int 的 数组 (元 素 个 数 10 》， 但 并 不 妨碍 将 其 类 型 
分 类 “数组 ”变换 为 “指针 ”。 


图 3-12 表现 了 其 变换 的 过 程 。 





Na 























Q@ 中 国 国家 标准 GB/T 15272-94 ( 189 页 ) 中 ， 也 是 将 lvalue 解释 成 左 值 。 一 一 译 者 注 
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PP he 
表达 式 中 进 


行 类 型 变换 





| 


图 3-12 将 数组 解读 成 指针 





此 外 ， 数 组 被 解读 成 指针 的 时 候 ， 该 指针 不 能 作为 左 值 。 
这 个 规则 有 以 下 的 例外 情况 。 


@ 数组 为 sizeof 运算 符 的 操作 数 














在 通过 “sizeof 表达 式 ” 的 方式 使 用 sizeof 运算 符 的 情况 下 ， 如 果 操 
作 数 是 “表达 式 ”， 此 时 即使 对 数组 使 用 sizeof， 数 组 也 会 被 当成 指针 ， 得 
到 的 结果 也 只 是 指针 自身 的 长 度 。 照 理 来 分 析 ， 应 该 是 这 样 的 吧 ? 可 是 ， 当 
数组 成 为 sizeof 的 操作 数 时 ,“ 数 组 解读 为 指针 ”这 个 规则 会 被 抑制 ， 此 时 
返回 的 是 数组 全 体 的 大 小 。 请 参照 3.3.1 节 的 补充 内 容 。 





















































@ 数组 为 & 运 算 符 的 操作 数 


通过 对 数组 使 用 &， 可 以 返回 指向 整体 数组 的 指针 。 在 3.2.4 节 中 已 经 介绍 
了 “指向 数组 的 指针 "”。 























这 个 规则 已 经 被 追加 到 ANSIC 规则 之 中 。 此 前 的 编译 器 ,在 对 数组 使 用 
& 的 时 候 ， 大 多 会 报错 。 因 此 ， 当 时 的 程序 在 这 一 点 上 不 会 出 现 问题 。 那 么 这 
个 规则 的 制定 有 什么 好 处 呢 ? 我 想 应 该 是 为 了 保持 统一 吧 。 


日 初始 化 数组 时 的 字符 串 常量 






































我 们 都 知道 字符 串 常量 是 “char 的 数组 ”, 在 表达 式 中 它 通常 被 解读 成 “ 指 
向 char 的 指针 ”。 其实 , 初始 化 char 的 数组 时 的 字符 串 常 量 ,作为 在 花 括号 
中 将 字符 用 逗号 分 开 的 初始 化 表达 式 的 省 略 形式 ， 会 被 编译 器 特别 解释 ( 人参 
有 照 3.5.3 节 )。 























在 初始 化 char 的 指针 的 时 候 , 字符 串 常 量 的 特别 之 处 ， 需 要 引起 注意 。 
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3.3.4 ”数组 和 指针 相关 的 运算 符 
以 下 介绍 数组 和 指针 相关 的 运算 符 。 
全 解 引 用 
单 目 运算 符 * 被 称 为 解 引用 。 


运算 符 * 将 指针 作为 操作 数 ， 返 回 指针 所 指向 的 对 象 或 者 函数 。 只 要 不 是 
返回 函数 ， 运 算 符 * 的 结果 都 是 左 值 。 


从 运算 符 * 的 操作 数 的 类 型 中 仅仅 去 掉 一 个 指针 后 的 类 型 ， 就 是 运算 符 * 
返回 的 表达 式 的 类 型 〈 参 照 图 3-13 )。 


i 0 I 


变 成 从 * 运 算 符 的 操作 数 的 类 
型 中 仅仅 去 掉 一 个 指针 后 的 类 型 


sl ,| 


图 3-13 使 用 解 引 用 而 发 生 的 类 型 的 变化 
























































全 地 址 运算 符 
单 目 运算 符 & 被 称 为 地 址 运算 符 。 


& 将 一 个 左 值 作为 操作 数 ， 返 回 指向 该 左 值 的 指针 。 对 左 值 的 类 型 加 上 一 
个 指针 ， 就 是 & 运 算 符 的 返回 类 型 (参照 图 3-14 )。 


EJ 


变 成 对 左 值 的 类 型 加 
上 一 个 指针 后 的 类 型 
i I i 


图 3-14 ”使 用 地 址 运算 符 而 发 生 的 类 型 的 变化 
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地 址 运算 符 不 能 将 非 左 值 的 表达 式 作为 操作 数 。 
全 下 标 运算 符 

后 置 运算 符 口 被 称 为 下 标 运算 符 。 

口 将 指针 和 整数 作为 操作 数 。 

p[i] 





是 
*(p + i) 
的 语法 糖 ， 除 此 以 外 没有 任何 其 他 意义 。 
对 于 声明 为 int a[10] 的 数组 ,使 用 a[ 刘 的 方式 进行 访问 的 时 候 ， 由 于 


a 在 表达 式 中 , 因此 它 可 以 被 解读 成 指针 。 所 以 ,你 可 以 通过 下 标 运 算 符 访问 
数组 〈 将 指针 和 整数 作为 操作 数 )。 


归根 结 底 ，p[i] 这 个 表达 式 就 是 *(p + 1)， 所 以 下 标 运算 符 返 回 的 类 型 
是 ， 从 p 的 类 型 去 掉 一 个 指针 的 类 型 。 








全 一 > 运算 符 
在 标准 中 ， 似 乎 并 没有 定义 -> 运算 符 的 名 称 ， 现 实 中 有 时 它 被 称 为 “ 箭 
通过 指针 访问 结构 体 的 成 员 的 时 候 ， 会 使 用 -> 运算 符 。 
p->hoge; 
是 
(*p) .hoge; 
的 语法 糖 。 
利用 *p 的 *， 从 指针 p 获得 结构 体 的 实体 ， 然 后 引用 成 员 hoge。 





3.3.5 “多维 数组 
在 3.2.5 节 中 ， 我 们 提 到 了 C 语言 中 不 存在 多 维 数 组 。 
那些 看 起 来 像 多维 数 组 的 其 实 是 “数组 的 数组 ”。 
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这 个 “多 维 数组 ”( 山寨 货 ), 通常 使 用 hoge[i] [jj 的 方式 进行 访问 。 让 
我 们 来 看 一 看 这 个 过 程 中 究 况 发生 了 什么 。 


int hoge[3][5]; 


对 于 上 面 这 个 “数组 的 数组 ”, 使 用 hoge[i] [j] 这 样 的 方式 进行 访问 ( 参 
照 图 3-15 )。 









































假定 hoge[i] [] 中 

的 1==2，j==3 @ 
对 于 int hoge[3] [5] 
的 内 存 的 状态 

2 
hoge 指 向 这 里 
int 的 数组 (元素 个 数 5) 
@-0 
hoge 是 int 的 数组 (元 素 个 


@-© 

通过 *(hoge + 让 中 的 *， 
去 控 一 个 指针 ， 其 类 型 就 为 
这 样 的 数组 


数 5) 的 指针 ， 根 据 加 法 运算 ， 


上 § 针 会 前 移 这 么 多 距离 


©@-© 
可 是 ， 央 为 在 表达 式 
中 ， 所 以 被 解读 为 指 一 之 
针 《指向 int 的 指针 ) 

































对 int 的 指针 进行 加 
法 运算 ， 取 出 实体 








图 3-15 访问 多 维 数 组 








@ hoge 的 类 型 为 “int 的 数组 (元 素 个 数 5 ) 的 数组 (元 素 个 数 3》。 
@ 尽管 如 此 ， 在 表达 式 中 数组 可 以 被 解读 成 指针 。 因 此 ，hoge 的 类 
型 为 “指向 int 的 数组 (元素 个 数 5) 的 指针 ”。 
四 hoge[i] 是 x*(hoge + 1 的 语法 糖 。 
@ 给 指针 加 上 1， 就 意味 着 指针 前 移 它 指向 的 类 型 Xi 的 距离 。 
hoge 指向 的 类 型 为 “int 的 数组 (元素 个 数 5)， 因此，hoge 
+ 1 让 指针 前 移 了 sizeof(int[5])xi 的 距离 。 
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@ 通过 *(hoge + i) 中 的 *， 去 掉 一 个 指针 ，*(hoge + i 的 类 型 
就 是 “指向 int 的 数组 ( 元素 个 数 $)》。 
图 尽管 如 此 , 由 于 在 表达 式 中 ,数组 可 以 解读 成 指针 , 所 以 x(hoge 
+ i) 的 最 终 类 型 为 “指向 int 的 指针 ”。 
@ (x(hoge + i))[j] 和 x((x*(hoge + i)) + j) 其 实 是 相等 的 ， 因 
此 ，(*(hoge + 1i))[j] 就 是 “对 指向 int 的 指针 加 上 j 后 得 到 
的 地 址 上 的 内 容 ”"， 其 类 型 为 int。 

某 些 语言 中 ,使 用 array[i，j] 这 样 的 写法 来 支持 多 维 数组 `。 

在 C 中 ， 因 为 没有 多 维 数 组 ， 所 以 使 用 “数组 的 数组 ”来 代替 ， 这 样 倒 
也 没有 什么 问题 。 可是， 如果 反 过 来 ,只 有 多 维 数组 ,而 没有 “数组 的 数组 ”， 
事情 就 麻烦 了 。 

比如 ， 将 某 人 一 年 之 中 每 天 的 工作 时 间 使 用 下 面 这 个 “数组 的 数组 ”来 
表现 ， 

int working_time[12][31] ; 

在 这 里 ， 如 果 开 发 一 个 根据 一 个 月 的 工作 时 间 计 算 工 资 的 函数 ， 可 以 像 
下 面 这 样 将 某 月 的 工作 时 间 传 递 给 这 个 函数 ， 

calc_salary(working_time[month]); 
calc_salary 的 原型 像 下 面 这 样 : 

int calc_salary(int *working_time); 


这 种 技巧 只 有 通过 “数组 的 数组 ”才能 实现 ， 多 维 数组 是 无 能 为 力 的 。 


























补 
Ey 充 运算 符 的 优先 级 


C 语 言 中 有 数量 众多 的 运算 符 ， 其 优先 级 分 15 个 级 别 。 
和 其 他 语言 相 比 ，C 语言 的 优先 级 别 还 是 非常 多 的 。 很 多 C 的 参考 书 ， 
都 像 表 3-5 这 样 记载 了 运算 符 优先 级 的 内 容 。 
其 中 ， 对 于 优先 级 “最 高 ”的 是 ()， 有 相当 多 的 人 抱 有 以 下 观点 : 
当 需 要 改变 原本 语法 规定 的 优先 级 、 强 制 地 设 定 自己 需 

要 的 优先 级 的 时 候 ， 程 序 员 们 会 使 用 CI。 因 此 ，G 具有 最 高 

的 优先 级 是 理所当然 的 。 
这 是 一 种 误解 。 
如 果 () 可 以 这 样 理解 ， 还 有 必要 特地 将 它 记 载 在 优先 级 的 表 中 吗 ? 





水 


党 


Pascal 就 支持 这 样 的 写 
法 , 但 是 , Pascal 的 “多 
维 数组 ”只 不 过 是 “ 数 
组 的 数组 ”的 语法 糖 。 


数组 中 , 月 和 日 是 从 0 
开始 的 ,只 有 在 输出 的 
时 候 才 可 修正 。2 月 等 
情况 下 ,数组 的 元 素 就 
会 显得 元 余 , 但 是 不 会 


产生 问题 。 
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这 个 表 中 的 O ，( 正 如 K&R 中 记述 的 那样 ) 代 表 着 调用 函数 的 运算 符 。 此 
时 的 优先 级 是 指 , 对 于 func(a, b) 这 样 的 表达 式 , func 和 (0 之 间 的 关联 强度 。 
表 3-5 ”运算 符 优先 顺序 表 〈 摘 录 于 K&R p.65) 





运 算 符 连接 规则 

© 凤 吉 全 者 
ee 风 入 全 大 
人 从 左 往 右 
和 从 左 往 右 
区 从 左 往 右 
2 从 左 往 右 
5 析 从 左 往 右 
3 从 左 往 右 
A 从 左 往 右 
从 左 往 右 
&& 从 左 往 右 
中 从 左 往 右 
区 从 右 往 左 
Se 从 右 往 左 
从 左 往 右 








注 : 进行 单 目 运算 的 +、-、& 和 * 的 优先 级 高 于 进行 双 目 运算 的 +、-、& 和 和 *。 
此 外 ,我们 经 常 看 到 类 似 于 下 面 这 样 的 编码 : 
*p++; 
究竟 是 对 p 进行 加 法 运算 ? 还 是 对 p 所 指向 的 对 象 ( *p ) 进行 加 法 运 
算 ? 关于 这 一 点 ， 很 多 书 是 这 样 解释 的 : 
尽管 x 和 ++ 的 优先 级 相同 ,但 由 于 连接 规则 是 从 右 往 左 ， 所 以 
p 和 ++ 先 进行 连接 。 因 此 ， 被 进行 加 法 运算 的 不 是 rzp， 而 是 p。 
就 连 KR 自身 也 是 这 样 说 明 的 。 其 实 这 种 说 法 不 太 恰 当 。 
根据 BNE ( Backus-Naur Form ) 规则 ，C 语言 标 准 定 义 了 语法 规则 ， 其 
中 也 包含 了 运算 符 的 语法 规则 。 
关于 BNF， 由 于 超出 了 本 书 的 范围 ， 在 此 就 不 做 说 明了 。 根据 BNF， 
# 参照 K&R 中 的 标准 ” 后 置 的 ++ 比 前 置 的 ++ 和 * 等 运算 符 的 优先 级 高 ，() 和 [] 的 优先 级 相同 。 
632 和 63.3。 也 就 是 说 ， 关 于 *p++ 的 运算 符 优先 级 ， 


后 置 的 ++ 比 * 的 优先 级 高 ， 因 此 ， 被 进行 加 法 运算 的 不 是 *p， 而 是 p。 
从 语法 上 来 看 ， 这 种 说 法 才 是 比较 合理 的 。 
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3.4 解读 C 的 声明 ( 续 ) 


3.4.1 ”const 修饰 符 
const 是 在 ANSIC 中 追加 的 修饰 符 ， 它 将 类 型 修饰 为 “只 读 ”。 


名 不 副 实 的 是 ，const 不 一 定 代表 常量 。const 主要 被 用 于 修饰 函数 的 
参数 。 将 一 个 常量 传递 给 函数 是 没有 意义 的 。 无 论 怎样 ， 使 用 const 修饰 符 
(变量 名 )， 只 意味 着 使 其 “只 读 ”。 


/* COnst 参数 的 范例 */ 
char x*strcpy(char xdest, const char *src) ; 


strcpy 是 持 有 被 const 修饰 的 参数 的 范例 。 此 时 ,所谓 的 “只 读 ” 是 如 
何 表现 的 呢 ? 
做 个 实验 应 该 很 快 就 会 明白 , 上 面 例子 中 的 src 这 个 变量 没有 定义 为 只 读 。 


char *my_strcpy(Cchar *dest，CcConst char *src) 


{ 
} 
此 时 ， 成 为 只 读 的 不 是 src， 而 是 src 所 指向 的 对 象 。 


char x*my_strcpy(char x*dest, const char *src) 


{ 
} 
如 果 将 src 自 南 定义 为 只 读 ， 需 要 写成 下 面 这 样 : 


char x*my_strcpy(char *dest, char * const src) 


{ 
} 
如 果 将 src 和 src 指向 的 对 象 都 定义 为 只 读 ， 可 以 写成 下 面 这 相 


char *my_strcpy(Cchar *dest，CcConst char * Const src) 


{ 












































~ 























src = NULL; 一 一 即使 对 Src 赋值， 编译 器 也 没有 报错 

















*SrC = 'a'; —— ERROR!! 























src = NULL; —— ERROR!! 




















I 





src = NULL; —— ERROR!! 
*SrC = 'a'; —— ERROR!! 
} 


在 现实 中 ， 当 指针 作为 参数 时 ，const 常用 于 将 指针 指向 的 对 象 设 定 为 


只 读 [e] 
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通常 ，C 的 参数 都 是 传 值 。 因 此 ， 无 论 被 调用 方 对 参数 进行 怎样 的 修改 ， 
都 不 会 对 调用 方 造成 任何 影响 。 如 果 想 要 影响 调用 方 的 变量 ( 通过 函数 参数 
将 函数 内 的 一 些 值 返回 )， 可 以 将 指针 作为 参数 传递 给 函数 。 


可 是 ， 在 上 面 的 例子 (my_strcpy ) 中 ,传递 的 是 src 这 个 指针 。 其 本 
来 的 意图 是 想 要 传递 字符 串 ( 也 就 是 char 的 数组 ) 的 值 , 由 于 在 C 中 数组 是 
不 能 作为 参数 传递 的 ， 情 非得 已 才 不 得 不 将 指向 初始 元 素 的 指针 传递 给 函数 
( 因为 数组 可 能 会 很 大 ， 所 以 传递 指针 有 益 于 提高 程序 的 效率 )。 

产生 的 问题 是 ， 为 了 达到 从 函数 返回 值 的 目的 ， 需 要 向 函数 传递 一 个 指 
针 ， 这 种 方式 让 人 感觉 有 些 混乱 。 

此 时 ， 考 虑 在 原型 声明 中 加 入 const， 

尽管 函数 接受 了 作为 参数 的 指针 ， 但 是 指针 指向 的 对 象 不 会 被 















































函数 虽然 接受 了 指针 ， 但 是 并 不 意味 着 要 向 调用 方 返回 值 。 
strcpyO) 的 意图 就 是 src 是 它 的 输入 参数 ， 但 是 不 允许 修改 它 所 指 
向 的 对 象 。 
可 以 通过 以 下 的 规则 解读 const 声明 : 
@ 遵从 3.1.2 节 中 提 到 的 规则 ， 从 标识 符 开 始 ， 使 用 英语 由 内 向 外 顺序 地 
解释 下 去 。 
@ 一 旦 解释 完毕 的 部 分 的 左 侧 出 现 了 const， 就 在 当前 位 置 追加 read-only。 
@ 如 果 解 释 完 毕 的 部 分 的 左 侧 出 现 了 数据 类 型 修饰 符 ， 并 且 其 左 侧 存在 
const， 姑 且 先 去 掉 数 据 类 型 修饰 符 ， 追 加 read-only。 
@ 在 翻译 成 中 文 的 过 程 中 ， 英 语 不 好 的 同学 请 注意 : const 修饰 的 是 紧 
跟 在 它 后 面 的 单词 。 
因此 ， 
char * const src 
可 以 解释 成 : 
srcis read-only pointer to char 
字 src 是 指向 char 的 只 读 的 指针 


Char const *src 
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可 以 解释 成 : 





src is pointer to read-only char 
?src 是 指向 只 读 的 char 的 指针 
此 外 ， 容 易 造成 混乱 的 是 ， 


char const *src 





和 
const char *src 


的 意思 完全 相同 。 


3.4.2 ”如 何 使 用 const? 可 以 使 用 到 什么 程度 ? 
很 多 人 习惯 在 函数 注释 的 参数 说 明 部 分 , 使 用 Ci) 、Co) 、(i/0) 等 标记 ?。 
这 里 举 一 个 有 些 矫 探 造作 的 例子 。 


/六 六 六 六 米 米 六 米 米 六 米 米 六 六 米 六 六 米 米 六 六 六 六 玉米 六 六 六 六 六 玉米 六 玉米 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 
* Void search_point(char *name, double *x, double *y) 
* 





功能 : 将 名 称 作为 key， 检索 “点 ”， 返 回 坐 标 
参数 : (1) name 名 称 (检索 key) 

(0) X X 坐标 

(0) y y 坐标 


炒米 米 米 米 米 来 炒米 来 玉米 米 玉米 炒米 米 米 炒米 来 米 米 米 米 炒米 炒米 米 米 米 玉米 米 米 米 米 米 炒米 米 米 米 米 炒米 米 米 米 米 米 来 米 米 米 


* 
* 
* 
* 

















唉 ， 每 次 要 对 函数 做 这 样 的 注释 ， 是 不 是 有 点 麻烦 ”于 是 有 很 多 人 会 将 
别 的 函数 的 注释 一 成 不 变 地 复制 过 来 ， 事 后 还 鬼话 连篇 说 自己 忘 了 修改 了 。 
其 实 这 些 人 就 没 把 注释 当 回 事 儿 ， 他 们 认为 直接 看 代码 就 什么 都 可 以 明白 ， 
























































老 是 揪 着 注释 的 问题 不 放 ， 简 直 就 是 没事 找事 。 
在 这 里 的 注释 中 ， 虽 然 标 记 了 各 参数 是 (i) 还 是 (o) ， 但 编译 器 可 不 会 注 
意 到 这 些 。 
对 此 ，search_point 原型 使 用 下 面 的 方式 进行 声明 : # 如 果 不 用 const, 而 是 
void search_point(char const *name, double *x, double *y); 使 用 (i) 并 且 很 放心 
地 将 指针 就 这 样 传阅 
当 你 错误 地 向 name[i 订 赋值 的 时 候 ， 编 译 器 会 很 负责 任 地 向 我 们 提出 警告 给 了 函数 ,之 后 即使 变 





量 被 改写 了 ,你 也 很 难 
Q@ (i) 指 用 于 输入 的 参数 ，(o) 指 用 于 输出 的 参数 ，(1/o) 指 用 于 输入 输出 的 参数 。 一 一 译 马上 发 现 。 
者 注 
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因此 ， 比 起 在 注释 中 标记 什么 Ci) 或 者 (o) ， 使 用 const 可 靠 性 会 提高 很 多 ”。 
对 于 上 面 的 char const *name, 是 不 能 将 它 赋予 char* 类 型 的 变量 的 ( 除 
非 强制 转型 )。 其 中 的 理由 显而易见 : 如 果 单 纯 地 将 它 赋予 char* 类 型 的 变量 ， 
之 后 就 可 以 改写 name 所 指向 的 对 象 的 内 容 ，const 的 意义 就 霄 失 殖 尽 了 。 
同 理 , 将 char const * 类 型 的 指针 传递 给 使 用 char* 作 为 参数 的 函数 ， 
也 是 不 允许 的 。 因 此 , 一旦 给 指针 类 型 的 参数 设 定 了 const， 当 前 层次 以 下 的 
* 在 一 些 通用 函数 中 , 如 ”函数 就 必须 全 部 使 用 const 。 




















果 本 应 该 是 const 的 参 本 
这 样 一 个 结 5 
数 却 没有 加 上 const， 假设 有 这 样 一 个 结构 体 : 
会 经 常 导致 调用 方 无 typedef struct { 
法 使 用 const。 char *title; /x# 标 题 */ 
int price; /* 价 格 */ 


char isbn[32] ; /*ISBN*/ 


} BookData; 





将 上 面 这 个 结构 体 作为 输入 参数 的 函数 原型 ， 可 以 写成 下 面 这 样 : 
/** 注 册 书 的 数据 */ 


void regist_book(BookData const book_data); 

因为 使 用 了 const, 所 以 book_data 所 指向 的 对 象 是 禁止 改写 的 。 好 吧 ， 
现在 可 以 放心 地 将 BookData 传递 给 这 个 函数 了 …… 

不 幸 的 是 ， 我 们 发 现 被 传递 的 数据 中 ， 书 的 标题 (book_data->title) 
所 指向 的 内 容 是 可 以 被 改写 的 。 

之 所 以 发 生 这 样 的 事情 ， 是 因为 根据 指定 的 const 而 成 为 “只 读 ” 的 对 
象 只 是 “book_data 所 指向 的 对 象 自身 ”， 而 不 包括 “book_data 所 指向 的 对 
象 再 向 前 追溯 到 的 对 象 ”( 参照 图 3-16 )。 













































































它 所 指向 的 对 象 此 对 象 为 这 里 就 不 是 
为 read-only read-only réad-onlyT 


LTTTI 





图 3-16 const 的 边界 
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因此 ， 如 果 将 结构 体 BookData 修改 成 这 样 : 


typedef struct { 

2 试 着 将 *title 设 定 为 Const 
char const *title; /* 标 题 */ 
int price; /* 价 格 */ 
char iisbn[32]; /*ISBN*/ 


} BookData; 
这 一 次 ， 就 算是 上 帝 来 了 也 改 不 了 title 所 指向 的 对 象 了 ”。 x* Java 的 String 类 也 是 
0 不 可 变 (immutable ) 的 。 
正 因为 如 此 ， 很 多 人 对 const 究竟 能 为 现实 中 的 编程 提供 多 少 便利 持 怀 这 种 方式 当然 有 它 的 
益处 ,但 是 有 时 候 它 也 


会 给 你 带 来 麻烦 。 
饮 t 
Ty 充 const 可 以 代替 #define 吗 ? 


通常 ，C 语言 使 用 预 处 理 器 的 宏 功 能 定义 常量 ， 就 像 下 面 这 样 : 


#define HOGE_SIZE (100) 

















int hoge[HOGE_SIZE] ; 

可 是 ， 预 处 理 器 是 独立 于 C 语言 语法 的 ， 因 此 在 调试 的 时 候 时 常会 出 
现 一 些 问题 。 由 宏 定义 自身 的 问题 造成 的 错误 往往 爆发 在 使 用 它 的 地 方 ， 
这 给 纠 错 工作 带 来 很 大 的 困难 。 

车 不 起 ， 总 躲 得 起 吧 ? 大 不 了 不 使 用 “ 坑 黎 ”的 宏 ， 是 不 是 可 以 写成 
下 面 这 样 : 

const int HOGE_SIZE = 100; 


int hoge[HOGE_SIZE] ; 


亲 ， 写 成 这 样 还 是 不 行 !! 
尽管 在 C 中 ， 数 组 的 元 素 个 数 必须 为 常量 "， 但 无 论 怎样 ，const 修饰 。 * 但 是 , ISO C99 没有 这 
的 标识 符 不 是 常量 , 它 只 是 “只 读 ” 而 已 。 因此， 上 面 的 写法 还 是 错误 的 "。 样 的 规定 。 
六 C++ 另 当 别论 。 


3.4.3 typedef 


typedef 用 于 给 某 类 型 定义 别名 。 
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比如 9 
typedef char *String; 


过 以 上 的 声明 ， 以 后 对 于 “指向 char 的 指针 ”可 以 使 用 “String” 这 个 
名 


o 


» 





六 车 


可 以 按照 普通 的 变量 声明 的 顺序 来 解释 typedef。 对 于 上 面 的 “String”， 
如 果 像 对 待 变量 名 一 样 用 英语 的 顺序 进行 解释 ， 应 该 是 下 面 这 人 句 话 : 









































String is pointer to char 
他 String 是 指向 char 的 指针 


此 ，String 作为 “指向 char 的 指针 ”这 个 类 型 的 别名 被 声明 。 




















之 后 ， 在 使 用 String 时 ， 你 可 以 写成 这 样 : 


String hoge[10] ; 

















它 的 意思 是 : 


hoge is array (元 素 个 数 10) of String; 
他 hoge 是 String 的 数组 (元 素 个 数 10) 
如 果 将 String 和 被 定义 成 String 类 型 的 指向 char 的 指针 机 械 地 进行 置换 ， 
就 会 产生 下 面 的 解释 : 

















hoge is array (元 素 个 数 10) ofpointerto_ char; 
也 hoge 是 指向 char 的 指针 的 数组 (元 素 个 数 10) 
语法 上 ，typedef 属于 “存储 类 型 修饰 符 ”( 参照 2.2.1 节 的 补充 内 容 )。 
可 是 无 论 怎么 看 也 看 不 出 typedef 指定 了 “存储 类 别 ”。 其 实 与 此 无 关 ， 
typedef 之 所 以 被 划分 为 存储 类 型 修饰 符 ， 应 该 是 由 于 指定 类 型 的 语法 沿用 
了 通常 声明 标识 符 的 语法 规则 。 


要 点 
typedef 使 用 和 通常 的 标识 符 声明 相同 的 方式 进行 解释 。 
可 是 ， 被 声明 的 不 是 变量 或 者 函数 ， 而 是 类 型 的 别名 。 




















* 也 有 人 吐 视 这 样 的 风 ”平时 在 声明 结构 体 的 时 候 ， 我 肯定 会 指定 typedef。 顺 便 提 一 下 ， 此 时 
ee 我 会 尽 可 能 省 略 tag 。 


typedef struct { 


} Hoge; 
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这 个 声明 没有 什么 特别 的 地 方 ， 关 于 结构 体 ， 假 设 写成 下 面 这 样 : 


struct Hoge_tag { 


} hoge; 
由 于 可 以 声明 struct Hoge_tag 类 型 的 变量 hoge， 如 果 将 和 这 个 变量 名 对 
应 的 部 分 置换 成 类 型 的 名 称 ， 就 变 成 了 typedef 的 声明 了 。 

此 外 ， 在 声明 变量 的 时 候 ， 可 以 像 下 面 这 样 一 次 性 声明 多 个 变量 : 

int a, b; 
同样 地 ，typedef 也 可 以 一 次 声明 类 型 的 多 个 别名 。 

可 是 这 么 做 ,除了 让 声明 难以 阅读 之 外 ， 你 得 不 到 任何 好 人 处。 偶尔 也 会 
见 到 下 面 这 样 的 声明 : 


typedef struct { 


} Hoge, *HogeP; 
这 个 声明 其 实 和 下 面 的 声明 效果 相同 : 


typedef struct { 








} Hoge; 


typedef Hoge *HogeP; 


3.5 ”其 他 


3.5.1 ”函数 的 形 参 的 声明 
C 语言 可 以 像 下 面 这 样 声明 函数 的 形 参 : 


void func(Cint a[]) 
E 





} 
对 于 这 种 写法 ,无论 怎 么 看 都 好 像 要 向 函数 的 参数 传递 数组 。 
可 是 ,在 C 中 是 不 能 够 将 数组 作为 函数 的 参数 进行 传递 的 。 无 论 如 何 ， 
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在 这 种 情况 下 ， 你 只 能 传递 指向 数组 初始 元 素 的 指针 。 
在 声明 函数 形 参 时 ， 作 为 类 型 分 类 的 数组 ， 可 以 被 解读 成 指针 。 





void funcCint a[]) 


{ 


} 
可 以 被 自动 地 解读 成 


void funcCint *a) 


{ 


} 
此 时 ， 就 算 你 定义 了 数组 的 元 素 个 数 ， 也 会 被 无 视 。 


必须 引起 注意 的 是 , 在 C 语 言 中 , 只 有 在 这 种 情况 下 ,int a[] 和 int *a 
具有 相同 的 意义 。 请 同时 参照 3.5.2 节 。 











要 点 


【 非常 重要 !1!】 
只 有 在 声明 函数 形 参 的 情况 下 ，int a[] 和 int *a 才 具 有 相同 的 意义 。 


下 面 是 一 个 稍微 复杂 一 点 的 形 参 声 明 的 例子 : 


void func(Cint a[][5]) 
a 的 类 型 为 “int 的 数组 ( 元素 个 数 5 ) 的 数组 ( 元素 个 数 不 明 》， 因 此 
它 可 以 解读 成 “指向 int 数组 〈 元素 个 数 $ ) 的 指针 ”。 因 此 ， 上 面 的 声明 本 


来 的 意思 心 AE: 
void func(int (x*a)[5]) 


补 
馈 充 K&A 中 关于 函数 形 参 声明 的 说 明 


KC&R 的 p.121 中 ， 有 下 面 这 样 一 段 记述 : 


作为 函数 定义 的 形 参 ， 


























char s[]; 
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和 


char *s; 





是 完全 相同 的 。 我 们 认为 写成 后 面 这 样 比较 好 ， 因 为 这 种 写 
法 能 更 加 明确 地 表示 这 里 的 参数 是 一 个 指针 。 




















这 段 文字 本 身 可 能 并 没有 什么 问题 。 可 是 在 K&R 中 ， 这 段 文字 是 在 说 
明了 *Cpa + i) 和 pa[i] 之 后 唐 突 地 出 现 的 。 因 此 ， 读 者 非常 容易 读 汤 挤 前 
面 的 “作为 函数 定义 的 形 参 ” 这 个 前 提 条 件 "。 


此 外 , 在 这 个 例子 中 , 为 什么 右边 加 上 了 分 号 ? ANSIC 中 , 定义 形 参 
的 时 候 一 般 是 不 加 分 号 的 ， 莫 非 早期 的 C 语言 就 是 这 样 的 ? 还 是 忘 了 修正 
第 一 版 的 内 容 ? 


更 让 人 费解 的 是 ， 在 K&R 中 ， 接 着 还 有 下 面 这 段 文 字 ， 


在 向 函数 传递 数组 名 的 时 候 ， 函 数 会 根据 情况 判断 它 是 作为 
数组 传 入 的 ， 还 是 作为 指针 传 入 的 ， 并 进行 相应 的 操作 。 


至 少 对 于 我 来 说 ， 真 的 是 完全 不 明白 这 上 段 文字 的 意思 。 
真相 应 该 是 : 


对 于 C 语 言 ， 在 表达 式 中 的 数组 可 以 被 解读 成 “指向 初始 元 
素 的 指针 ” 
vy 
函数 的 参数 也 是 表达 式 ， 所 以 ， 此 时 的 数组 也 可 以 被 解读 成 
向 初始 元 素 的 指针 ” 
vy 
因此 ， 向 函数 传递 的 往往 是 指针 。 


C 也 不 具备 “函数 会 根据 情况 判断 它 是 作为 数组 传 入 的 ， 还 是 作为 指 
针 传 入 的 ， 并 进行 相应 的 操作 ”这 么 神 的 超 能 力 。 只 是 指针 经 常 被 作为 参 
数 向 函数 传递 村 了 。 

实际 上 ， 对 于 刚才 那 段 引用 中 的 


我 们 认为 写成 后 面 这 样 比较 好 ， 因 为 这 种 写法 能 更 加 明确 地 
表示 这 里 的 参数 是 一 个 指针 。 


于 


a 





























水 


党 


此 外 , 原 书 中 “作为 函 
数 定义 的 形 参 ”( As 
formal parameters in a 
function definition ) 这 
句 话 正好 到 了 页 尾 , 这 
又 增 大 了 读者 漏 读 的 
可 能 性 。 


这 应 该 不 是 翻译 过 程 


1 原 书 中 就 已 
经 加 上 了 分 号 。 
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这 段 话 ， 让 人 费解 的 是 ， 


如 果 C 语 言 的 作者 认为 后 面 的 写法 比较 好 ， 为 什么 
只 有 在 函数 形 参 中 ， 数 组 的 声明 才 可 以 被 解读 为 指针 ” 个 奇 
怪 的 规则 光 ? 
关于 这 一 点 ,“The Development oftheCLanguage” 回 中 有 这 样 一 段 说 
明 : 

















Moreover, some rules designed to ease early transitions contributed 

to later confusion. For example, the empty square brackets in the function 
declaration 

Mnte fCad inte 

are a living fossil, a remnant of NB’s way of declaring a pointer; 
翻译 成 中 文 是 : 

为 了 容易 地 进行 旱 期 的 移植 而 设计 的 几 个 规则 ， 之 后 带 来 了 

* 这 是 ANSI C 以 前 的 一 些 混乱 。 比 如 函数 声明 * 的 空 方 括号 ， 
mnt fCaD lint ea 


就 是 一 个 活化 石 ，NB ( New B ) 的 指针 声明 方法 留 下 的 后 遗 证 。 


3.5.2 ”关于 空 的 下 标 运算 符 [] 
在 C 语 言 中 ， 遇 到 以 下 情况 下 标 运算 符 口 可 以 将 元 素 个 数 省 略 不 写 。 


对 于 这 些 情况 ， 不 同 编译 器 会 有 各 自 特 别 的 解释 ， 所 以 不 能 作为 普遍 的 
规则 来 使 用 。 


函数 形 参 的 声明 
正如 3.5.1 节 中 说 明 的 那样 ， 对 于 函数 的 形 参 ， 最 外 层 的 数组 会 被 解读 成 
指针 ， 即 使 定义 了 元 素 个 数 也 会 被 无 视 。 
@ 根据 初始 化 表达 式 可 以 确定 数组 大 小 的 情况 


在 下 面 的 情况 下 ， 编 译 器 可 以 根据 初始 化 表达 式 来 确定 元 素 的 个 数 ， 所 
以 可 以 省 略 最 外 层 数 组 的 元 素 个 数 。 


{1, 2, 3， 4,5}; 
= "abc" 


























int a[] = 
char str[] 
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double matrix[][2] = {{1, 0}, {0, 1}}; 
char *Ccolor_name[] = { 
"red", 
"green", 
"blue", 
}; 
char color_name[][6] = { 
"red", 
"green", 
"blue", 
}; 





在 初始 化 数组 的 数组 的 时 候 ， 如 果 有 初始 化 表达 式 ， 貌 似 即 使 不 是 最 外 层 
的 数组 ， 编 译 需 也 应 该 能 够 确定 其 元 素 个 数 。 可 是 ， 在 C 语 言 中 ， 人 允许 下 面 这 
样 不 整齐 的 数组 初始 化 , 因此 还 是 不 能 简单 地 确定 最 外 层 数组 以 外 的 元 素 个 数 。 

int a[][3] = { /* int a[3][3] 的 省 略 形式 */ 

人 2 的 到 


{4， 5}, 
{6} 











}; 


char str[][5] = { /* char str[3][5] 的 省 略 形式 */ 
"hogen ， 
"hog", 
"ho", 

}; 


似乎 可 以 考虑 让 编译 器 选择 一 个 最 大 值 ， 但 C 的 语法 并 没有 这 么 做 。 


如 果 这 么 做 是 为 了 排查 程序 员 的 编程 失误 ， 那 为 什么 没有 把 上 面 “不 整 
齐 的 数组 ”也 规定 为 错误 ”对 于 这 种 现象 ， 我 至 今 百 思 不 得 其 解 〈 英 非 只 是 
因为 牙 忽 ? )。 


顺便 说 一 下 ， 在 初始 化 上 面 这 样 不 整齐 的 数组 的 时 候 ， 没 有 对 应 的 初始 
化 表达 式 的 元 素 会 被 初始 化 为 0。 


人 @@ 使 用 extern 声明 全 局 变量 的 情况 
全 局 变量 在 多 个 编译 单元 (.c 文件 ) 中 的 某 一 个 中 定义 , 然后 从 其 他 代码 




































































文件 通过 extern 进行 声 





明 。 














在 定义 的 时 候 还 是 需要 元 素 个 数 的 ， 但 是 在 使 朋 
候 ， 在 连接 的 时 候 编译 

















组 的 元 素 个 数 。 





需 可 以 确定 实际 的 数组 大 小 ， 


月 extern 进行 声明 的 时 
所 以 可 以 省 略 最 外 层 数 


正如 前 面 说 明 的 那样 ， 只 有 在 声明 函数 形 参 的 时 候 ， 数 组 的 声明 才 可 以 
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被 解读 成 指针 。 


像 下 面 这 样 进行 全 局 变量 声明 的 时 候 ， 将 数组 和 指针 混在 一 起 ， 除 了 程 
序 不 能 正常 运行 之 外 ， 编 译 器 通常 也 不 会 报告 任何 警告 或 者 错误 。 这 一 点 需 
# 如 今 的 链接 器 ,有 时 也 ”要 引起 注意 ”。 





























会 报错 。 
file_1.c…… 中 
int  a[100] ; 
file_2.c…… 中 


extern int *a; 


解冻 

< ps 5 高 定义 和 声明 
在 C 语 言 中 ,“ 声 明 ” 在 规定 变量 或 者 函数 的 实体 的 时 候 被 称 为 “定义 ”。 
比如 ， 像 下 面 这样 声 明 全 局 变量 的 行为 ， 就 是 “定义 ” 。 

* 准确 地 说 ，int a; 这 样 

的 定义 属于 暂时 定义 0 

temanve dio ); 以 下 的 extern 的 声明 ,意味 着 “使 在 某 处 声明 的 对 象 能 够 在 当前 的 地 

Re 使 用 ”， 因 此 它 不 是 “定义 ” 

上 了 初始 化 表达 式 的 杷 ， BA RS 

定义 属于 “外 部 定义 ”。 


extern int a; 


同样 地 ， 函 数 的 原型 是 “声明 ”， 函 数 的 “定义 ”是 指 写 着 函数 的 实际 


执行 代码 的 部 分 。 
自动 变量 的 情况 下 ， 区 别 定义 和 声明 是 没有 意义 的 ， 因 为 此 时 声明 必 
然 伴随 着 定义 。 


3.5.3 ”字符 串 常 量 
使 用 "包围 起 来 的 字符 串 被 称 为 字符 串 常 量 。 
字符 串 常 量 的 类 型 是 “char 的 数组 ”， 因 此 在 表达 式 中 ， 它 可 以 解读 为 





指针 。 
Char *str; 
str = "abc"; 一 一 将 [指向 "abc" 的 初始 元 素 的 指针 」 赋 给 Str 


可 是 ，char 数组 的 初始 化 是 个 例外 。 此 时 的 字符 串 常 量 ， 作 为 在 花 括号 
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中 分 开 书 写 的 初始 化 表达 式 的 省 略 形式 ， 编 译 器 会 进行 特殊 处 理 。 















































char str[] = "abc'"; 

和 
char str[] = {'a', 'b', 'c', '\0'} 

具有 相同 的 含义 。 
以 前 C 语 言 只 有 标量 ， 所 以 不 能 初始 化 自动 变量 的 数组 。 因 此 ， 
char str[] = {'a', 'b', 'c', '\0'}; 

必须 写成 下 面 这 样 : 
static char str[] = {'a'’, 'b', 'c', '\0'}; 
同样 地 ， 
char str[] = "abc"; 

这 样 的 写法 也 是 不 允许 的 ， 你 必须 写成 下 面 这 样 : 
static char str[] = "abc"; 

















可 是 , 从 ANSIC 开始 ， 即 使 是 自动 变量 的 数组 ， 也 可 以 被 整合 来 进 
始 化 。 


char str[] = "abe"; 

正 因 为 如 此 ， 上 面 的 写法 是 合法 的 。 所 以 ， 
char str[4]; 
str = "abc"; 


这 样 的 写法 是 非法 的 。 























行 初 


你 是 不 是 有 点 量 了 ? 下 面 的 例子 不 是 初始 化 char 的 数组 , 而 是 初始 化 指 


针 ， 所 以 也 是 合法 的 : 


char x*str = "abc"; 


此 时 的 “abc” 就 是 普通 的 “char 的 数组 ”， 在 表达 式 中 被 解释 成 “指向 





char 的 指针 ”， 然 后 被 赋 给 str。 








只 要 按 顺 序 对 标识 符 的 声明 和 初始 化 表达 式 中 花 括号 的 对 应 关系 进行 一 





步 步 分 析 ， 更 复杂 的 例子 也 一 定 能 够 解释 。 


char xcolor_name[] = { 
"red", 
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"green", 
"blue", 

反 

此 时 ， 标 识 符 color_name 的 类 型 为 “指向 char 的 指针 的 数组 ”， 类 型 
分 类 “数组 ”对 应 初始 化 表达 式 的 最 外 层 的 花 括号 ,因此 ,“red” 也 好 ,“blue” 
也 好 ， 它 们 都 是 “指向 char 的 指针 ”。 

char color_name[][6] = { 

"red", 
"green", 
"blue", 

}; 

这 个 例子 中 的 color_name 的 类 型 为 “char 的 数组 (元素 个 数 6 ) 的 数 
组 ”， 同 样 地 ， 类 型 分 类 “数组 ”， 对 应 于 初始 化 表达 式 的 最 外 层 的 花 括号 ， 
因此 , 无 论 是 “red”, 还 是 “blue”, 它们 都 是 “char 的 数组 ( 元素 个 数 6 了 。 
所 以 ， 上 面 的 声明 和 

char color_name[][6] = { 

{'r', 由 "0 '\0'}, 
{Os es 
{'b "1',，'u', 'e', '\0'}, 














具有 相同 的 意思 。 


通常 ， 字 符 串 常量 保存 在 只 读 的 内 存 区 域 ( 准确 地 说 ， 实 际 的 保存 方式 
还 是 要 依赖 处 理 环 境 的 具体 实现 的 )。 但 如 果 在 初始 化 char 的 数组 的 时 候 ， 
采取 将 原本 在 花 括号 中 分 开 书写 的 初始 化 表达 式 的 省 略 形式 ， 并 且 不 给 数组 
自身 指定 const， 字 符 串 常量 就 是 可 写 的 。 





















































char str[] = "abc"; 

str[0] = "'d'; 一 一 可 写 

但 如 果 写 成 下 面 这 样 ， 就 会 报错 : 

char *str = "abc"; 

str[0] = 'd'; 一 一 在 大 部 分 的 处 理 环境 中 会 报错 
饮 
> 充 字符 串 常量 就 是 char 的 数组 


字符 串 常量 的 类 型 是 “char 的 数组 ”。 
可 是 ， 在 表达 式 中 它 可 以 被 解释 成 “指向 char 的 指针 ”。 
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是 不 是 有 很 多 同学 认为 字符 囊 常 量 本 来 就 是 “指向 char 的 指针 ” 呢 ? 
通过 以 下 的 代码 ， 可 以 证 明 字 符 串 常量 本 质 还 是 数组 : 


printf("size..%d\n", sizeof("abcdefghijklmnopqrstuvwxyz")); 


3.5.4 ”关于 指向 函数 的 指针 引起 的 混乱 

正如 2.3.2 节 中 说 明 的 那样 ， 对 于 C 语言 ， 表 达 式 中 的 函数 可 以 被 解读 成 
“指向 函数 的 指针 "。 

在 信号 处 理 、 事 件 驱动 的 程序 中 , 这 种 特性 往往 以 回调 函数 的 形式 被 使 用 。 


/* 如 果 发 生 SIGSEGV (Segmentation falut) ,回调 函数 segv_handler */ 
signal(SIGSECGV, segv_handler); 


可 是 ， 如 果 基 于 之 前 说 明 过 的 C 语 言 声明 规则 ，int funcG 这 样 的 声明 
会 被 解释 为 “返回 int 的 函数 ”， 如 果 函 数 在 表达 式 中 ， 只 是 取出 func 解释 
成 “指向 返回 int 函数 的 指针 ”， 是 不 是 感觉 很 怪异 ”如果 一 定 要 使 用 指向 函 
数 的 指针 ， 必 须要 写成 &func。 

对 于 上 面 信号 处 理 的 函数 ， 写 成 

signal( 人 SIGSEGV，&segv_handler) ; 

这 样 ， 实 际 上 也 能 顺利 地 执行 。 

相反 ， 像 

void (#*func_p)() ; 

这 样 , 变量 func_p 声明 为 指 问 函 数 的 指针 ， 进 行 函 数 调 用 的 时 候 , 可 以 写成 
func_pO; 


但 是 像 int funcQ) 这 种 声明 ， 都 是 用 funcO 〇 这 样 的 方式 进行 调用 的 ， 从 对 
称 性 的 角度 考虑 ， 对 于 void (*func_p) ()， 必 须要 写成 


CH # 早期 的 C 语 言 中 , 好 像 
无 问题 地 执行 的 。 也 只 能 这 么 写 ……: 


是 不 是 感觉 C 请 言 的 关于 指向 函数 的 指针 的 语法 比较 混乱 ? 


混乱 产生 的 原因 就 是 :“ 表 达 式 中 的 函数 可 以 解读 成 “ 指 癌 函数 的 指针 ”” 
这 个 意图 不 明 的 规则 ( 难道 就 是 为 了 和 数组 保持 一 致 ? )。 
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为 了 照顾 到 这 种 混乱 ，ANSI C 标准 对 语法 做 了 以 下 例外 的 规定 : 


口 表达 式 中 的 函数 自动 转换 成 “指向 函数 的 指针 ”。 但 是 ， 当 函数 是 地 址 
运算 符 & 或 者 sizeof 运算 符 的 操作 数 时 ,表达 式 中 的 函数 不 能 变换 成 
“指向 函数 的 指针 ”。 

口 函数 调用 运算 符 O 〇 的 操作 数 不 是 “ 隐 数 ”"， 而 是 “函数 的 指针 ”。 


如 果 对 “指向 函数 的 指针 ”使 用 解 引用 *， 它 暂时 会 成 为 函数 ,但 是 因为 
在 表达 式 中 ， 所 以 它 会 被 瞬间 地 变 回 成 “指向 函数 的 指针 ”。 


结论 就 是 ， 即 使 对 “指向 函数 的 指针 ”使 用 * 运 算 符 ， 也 是 对 牛 弹琴 ， 
为 此 时 的 运算 符 * 发 挥 不 了 任何 作用 。 


此 , 下面 的 语句 也 是 能 顺利 执行 的 ， 


(六 六 六 六 六 六 炒米 六 pFPintf) ("hel1lo，world\n");} 一 一 无 论 如 何 ，* 就 是 什么 也 没 做 


3.5.5 ”强制 类 型 转换 
cast 是 将 某 类 型 强制 地 转换 成 其 他 类 型 的 运算 符 ， 它 写成 下 面 这 样 : 
(类 型 名 称 ) 
简单 地 说 ， 强 制 类 型 转换 有 两 种 使 用 方式 。 


其 一 是 基本 类 型 的 强制 转换 ， 比 如 像 下 面 这 样 想 要 将 int 作为 double 
来 使 用 的 情况 : 


int hoge, piyo; 



































































































































Be / piyo..%f\n", (double)hoge / piyo); 
x* 这 可 是 一 个 很 大 的 陷 阶 。 在 C 中 ,无 论 怎样 ，int 的 除法 运算 的 结果 还 是 int ， 如 果 想 要 得 到 小 数 

部 分 ， 上 面 除法 运算 符 的 某 一 边 〈 或 者 是 双方 ) 的 操作 数 必须 转换 成 double。 

此 时 , 强制 类 型 转换 将 int 类 型 的 值 转换 成 实际 的 double 类 型 。 编译 带 
在 大 多 数 情况 下 ， 会 生成 强制 转换 对 应 的 机 器 代码 。 

另外 一 个 强制 转换 的 方式 就 是 指针 类 型 的 强制 转换 。 

C 语言 编译 器 对 于 指针 类 型 , 根据 其 指向 的 类 型 的 不 同 , 分 别 采取 不 同 的 
对 待 方式 。 在 运行 时 ,无 论 是 指向 int 的 指针 , 还 是 指向 double 的 指针 ， 从 
机 器 语言 的 角度 来 看 ， 它 们 在 大 多 数 的 处 理 环境 中 都 只 是 地 址 。 所 谓 的 指针 
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的 强制 类 型 转换 ， 就 是 对 指针 进行 强制 读 取 转换 。 
比如 像 下 面 这 样 的 指针 强制 类 型 转换 : 


double double_var; 
int *int_p; 


int_p = (int*)&double_var; 一 一 将 指向 double 的 指针 转换 成 指向 int 的 指针 
一 旦 将 “指向 double 指针 ”强制 地 转换 为 “指向 int 的 指针 ”， 就 无 法 追踪 
8 针 原 本 指向 什么 对 象 了 。 
因此 ， 写 成 xint_p， 取 出 的 数据 类 型 为 int 类 型 ， 对 int_p 加 1， 指针 
前 移 sizeof(Cint) 。 
如 果 想 要 开发 出 可 移植 性 高 的 程序 ， 就 应 该 避免 对 指针 进行 强制 类 型 转 
换 。 规 范 的 编程 是 不 会 草率 地 对 指针 进行 强制 类 型 转换 的 ”。 
可 是 也 有 一 些 例外 ， 比 如 对 于 一 个 通用 的 GUI 类 库 程 序 ， 界 面 上 的 按钮 
等 控件 可 能 会 被 关联 各 种 类 型 的 数据 。 此 时 ,姑且 先 让 控件 关联 到 void*, 之 
后 根据 需要 再 将 其 强制 转换 到 关联 数据 的 本 来 的 类 型 。 现 实 中 的 指针 强制 类 
型 转换 的 场景 ， 大 致 也 就 是 这 种 程度 。 
“不 知道 为 什么 编译 需 提 示 了 和 警告， 姑且 先 来 一 把 强制 转型 ”一 “只 要 不 
再 出 现 警 告 ， 就 随 它 去 了 .…… 这 种 恶习 是 绝对 需要 避免 的 "。 
编译 器 是 不 会 无 端 地 给 出 警告 的 ， 强 制 类 型 转换 只 是 暂时 掩盖 了 问题 。 
就 算 通过 了 编译 ， 程 序 也 很 有 可 能 不 会 正常 运行 ， 要 不 就 是 虽然 在 当前 的 环 
境 中 能 正常 运行 ， 一 拿 到 别 的 环境 中 就 跑 不 起 来 了 。 
要 点 
不 要 使 用 强制 类 型 转换 来 掩盖 编译 器 的 警告 。 


3.5.6 ”练习 一 一 挑战 那些 复杂 的 声明 
应 该 是 小 试 牛刀 的 时 候 了 。 


在 ANSI C 的 标准 库 中 ， 有 一 个 atexit(0) 函 数 。 如 果 使 用 这 个 函数 ， 当 
程序 正常 结束 的 时 候 ， 可 以 回调 一 个 指定 的 函数 。 


atexit() 的 原型 定义 如 下 : 


int atexit(void (x*func) (void) ) ; 


































































































































































































x* 以 前 ，malloc() 的 返 
回 值 是 必须 要 进行 强 
制 转型 的 ， 但 到 了 
ANSIC 的 时 候 就 不 需 
要 这 么 做 了 。 
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@ 首先 着 眼 于 标识 符 。 
int atexit(void (*func) (void)); 
英语 的 表达 为 : 
atexit is 
@ 解释 用 于 函数 的 ()。 
int atexit(void (*func) (void)); 
英语 的 表达 为 : 
atexit is function() returning 
@@ 函数 的 参数 部 分 比较 复杂 , 所 以 先 解析 这 部 分 。 同样 地 , 先 着 眼 于 标识 符 。 
int atexit(void (*func) (void)); 
英语 的 表达 为 : 
atexit ls function(func is) returning 
@ 因为 有 括号 ， 所 以 这 里 解释 *。 
int atexit(void (*func) (void)); 
英语 的 表达 为 : 
atexit ls function(func is pointer to) returning 
@ 解释 用 于 函数 的 ()。 这 里 的 参数 还 是 比较 简单 的 , 是 void (无 参数 ) 。 
int atexit(void (*func) (void)); 
英语 的 表达 为 : 


atexit is function (func is pointer to function (void) returning) 
returning 


@ 解释 类 型 指定 符 void。 这 样 就 结束 了 atexit 的 参数 部 分 的 解释 。 
int atexit(void (*func) (void)); 
英语 的 表达 为 : 


atexitis function (func ls pointer to function (void) returning void) 
returning 


@ 解释 数据 类 型 修饰 符 int。 


int atexit(void (x*func) (void)); 
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英语 的 表达 为 : 


atexit ls function (func is pointer to function (void) returning void) 
returning int 


@ 翻译 成 中 文 …… 
atexit 是 返回 int 的 函数 〈 参 数 是 ， 指 向 返回 void 没有 参数 的 函数 的 指针 ) 。 
下 面 是 一 个 更 加 复杂 的 例子 。 
标准 库 中 有 一 个 signal1 0O) 函数 ， 它 的 原型 声明 如 下 ， 
void (xsignal(int sig, void (*func) (int))) (int); 
© 首先 着 眼 于 标识 符 。 
void (x*signal(int sig, void (x*func) (Cint))) Cint); 
英语 的 表达 为 : 
signal is 
@ 相 比 *，0) 的 优先 顺序 更 高 ， 所 以 先 解 释 这 部 分 。 
void (x*signal(int sig, void (*func) (int))) (int); 
英语 的 表达 为 : 
signal is function() returning 
@ 解释 参数 部 分 。 这 里 有 两 个 参数 ， 第 一 参数 是 int sig。 
void (x*signal(int sig, void (xfunc) (int))) Cint); 
英语 的 表达 为 : 
signal ls function(sig is int,) returning 
@ 着 眼 另 外 一 个 参数 。 
void (x*signal(int sig, void (*func) Cint)))Cint) ; 
英语 的 表达 为 : 
signal ls function(sig is int, func 1s) returning 
@ 因为 有 括号 ， 所 以 这 里 解释 *。 
void (x*signal(int sig, void (*func) (int))) Cint); 
英语 的 表达 为 : 


signal ls function(sig is int, func ls pointer to) returning 
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@ 解释 表示 函数 的 () ， 人 参数 为 int。 
void (*signal(Cint sig, void (xfunc) (int))) (int); 


英语 的 表达 为 : 

signal 1s function(sig is int, func ls pointer to function Cint) 
returning) returning 

@ 解释 数据 类 型 修饰 符 void。 


void (xsignal(int sig, void (x*func) (int))) (int); 





英语 的 表达 为 : 
signal ls function(sig is int, func is pointer to function Cint) 
returning void) returning 


@ 参数 部 分 已 经 解释 结束 。 接 着 因为 有 括号 ， 所 以 这 里 解释 *。 


void (x*signal(int sig, void (x*func) (int))) (int); 





英语 的 表达 为 : 
signal 1s function (sig 1S int， func 1s pointer to function(Cint) 
returning void) returning pointer to 
@ 解释 表示 函数 的 () ， 人 参数 为 int。 
void (*signal(Cint sig, void (*func) (Cint)))Cint) ; 





英语 的 表达 为 : 
signal is function(sig is int, func ls pointer to functionCint) 
returning void) returning pointer to functionCint) returning 


@ 最 后 ， 添 上 void。 
void (*signal(Cint sig, void (x*func) (int))) (int); 





英语 的 表达 为 : 
signal ls function(sig is int, func is pointer to function Cint) 
returning void) returning pointer to functionCint) returning void 


中 翻译 成 中 文 …… 
signal 是 返回 “指向 返回 void 参数 为 int 的 函数 的 指针 ”的 函数 ， 它 有 两 个 参数 ， 
一 个 是 int， 另 一 个 是 “指向 返回 void 参数 为 int 的 函数 的 指针 ”。 


能 读 懂 这 种 难度 的 声明 ， 我 想 应 该 不 会 再 有 什么 让 你 县 惧 的 C 声 
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下 面 的 说 明 可 能 会 让 你 对 C 语 言 感 到 更 加 不 快 。 


signa1() 是 用 于 注册 信号 人 处理 ( 当中 断 发 生 时 被 调用 的 函数 ) 的 函数 。 
此 函数 的 返回 值 是 之 前 注册 的 处 理 当 前 信号 中 断 的 函数 。 

也 就 是 说 , 其 中 的 一 个 参数 和 返回 值 , 它们 都 是 相同 的 类 型 一 一 指向 信和 号 
处理 函数 的 指针 。 在 一 般 的 语言 中 ， 同 样 的 表现 模式 出 现 两 次 并 不 会 让 你 感 
到 不 适 , 但 是 解释 C 语 言 声明 的 过 程 是 “一 会 儿 向 左 一 会 儿 向 右 ”,， 因 此 , 表 
示 返 回 值 的 部 分 散落 了 在 左右 两 侧 。 


此 时 ， 运 用 typedef 可 以 让 声明 变 得 格外 得 简洁 。 


/* 摘 录 于 FreeBSD 的 man page */ 
typedef void(*sig_t) (int); 















































sig_t signal(int sig, sig_t func); 


sig_t 代表 “指向 信号 处 理 函 数 的 指针 ”这 个 类 型 。 





3.6 ”应 该 记 住 : 数组 和 指针 是 不 同 的 事物 
3.6.1 为 什么 会 引起 混乱 


首先 ， 请 允许 我 强调 一 下 本 章 的 重要 观点 。 
C 语言 的 数组 和 指针 是 完全 不 同 的 。 

大 家 都 说 C 语言 的 指针 比较 难 ， 可 是 真正 地 让 初学 者 “ 搁 墙 ”的 ， 并 不 
是 指针 自身 的 使 用 ， 而 是 “混淆 了 数组 和 指针 ”。 此 外 ， 很 多 “ 坑 侈 ”的 入 门 
书 对 指针 和 数组 的 讲解 也 是 极其 混乱 。 

比如 ，KQ&R 中 就 有 下 面 一 段 文字 (p.119 )， 

C 语 言 的 指针 和 数组 之 间 有 很 强 的 关联 关系 ,因此 必须 将 指针 和 
数组 放 在 一 起 讨论 。 

很 多 C 程序 员 认 为 “数组 和 指针 是 几乎 相同 的 事物 ”， 这 种 认识 是 引起 C 
的 混乱 的 主要 原因 。 


从 图 3-17 中 可 以 一 目 了 然 地 看 出 ， 数 组 是 一 些 对 象 排列 后 形成 的 ， 指 针 
则 表示 指向 某 处 。 它 们 是 完全 不 同 的 。 
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数组 


上 和 
了 


图 3-17 数组 和 指针 


带 着 “数组 和 指针 是 几乎 相同 的 事物 ”这 样 的 误解 ， 初 学 者 经 常 写 出 下 
面 这 样 的 代码 : 


int *p; 




















p[3] = …… 一 一 突然 使 用 没有 指向 内 存 区 域 的 指针 
一 一 自动 变量 的 指针 在 初期 状态 ， 值 是 不 定 的 。 


char str[10] ; 


str = "abc"; 一 一 突然 向 数组 赋值 

一 一 数组 既 不 是 标量 ， 也 不 是 结构 体 ， 不 能 临时 使 用 。 

int p[]; 一 一 使 用 空 的 [] 声 明 局 部 变量 

一 一 只 有 在 “区 数 的 形 参 的 声明 ”中 ， 数 组 的 声明 才 可 以 被 解读 成 指针 。 


对 于 数组 和 指针 ， 它 们 在 哪些 地 方 是 相似 的 ， 又 在 哪些 地 方 是 不 同 的 一 一 
不 好 意思 ， 可 能 在 下 面 会 出 现 和 前 面 重复 的 内 容 。 


3.6.2 ”表达 式 之 中 


在 表达 式 中 ， 数 组 可 以 被 解读 成 指向 其 初始 元 素 的 指针 。 所 以 ， 可 以 写 
成 下 面 这 样 : 

int *p; 

int array[10]; 



































p = array; 一 一 将 指向 array[0j] 的 指针 赋予 p 
可 是 ， 反 过 来 写成 下 面 这 样 : 
* 此 时 的 指针 是 右 值 这 


个 理由 之 外 ,在 标准 和 . ek 
中 ,数组 也 不 是 “可 变 就 是 不 可 以 的 。 确 实 ， 在 表达 式 中 array 可 以 被 解读 成 指针 ， 可 是 ， 本 质 上 


更 的 左 值 ”。 它 其 实 是 被 解释 成 了 &array[0] ， 此 时 的 指针 是 一 个 右 值 ”。 
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比如 ， 对 于 int 类 型 的 变量 a，a = 10; 这 样 的 赋值 是 可 以 的 ， 但 肯定 没 
有 人 想 做 a + 1 = 10; 这 样 的 赋值 吧 。 尺 管 a 和 a + 1 都 是 int, 但 是 a+ 1 
没有 对 应 的 内 存 区 域 ， 只 是 一 个 右 值 ， 所 以 不 能 被 赋值 。 同 样 的 道理 ，array 
也 不 能 被 赋值 。 

此 外 ， 对 于 下 面 这 个 指针 ， 

int *p; 
如 果 p 指向 了 某 个 数组 ， 自 然 可 以 通过 p[ 订 的 方式 进行 访问 ， 但 这 并 不 代表 
p 就 是 数组 。 























p[i] 只 不 过 是 *(p + 站 的 语法 糖 ， 只 要 p 正确 地 指向 一 个 数组 ， 就 可 以 
通过 p[1] 对 数组 的 内 容 进行 访问 ， 就 像 图 3-18 表现 的 这 样 。 


p 


二 | ] 








数组 
图 3-18 ”使 用 指针 访问 数组 


如 果 是 “指针 的 数组 ”和 “数组 的 数组 ”， 就 会 有 很 大 的 不 同 。 









































char xcolor_name[] = { 一 一 指针 的 数组 
"red", 
"green", 
"blue", 

$3 


对 以 上 的 代码 进行 图 解 ( 参照 图 3-19 )， 





于 加 加 可 
是 国 加 本 王 禹 
古国 国 遇 可 


图 3-19 ”指针 的 数组 
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* 虽然 使 用 这 个 语法 糖 
可 以 让 多 维 数组 作为 
参数 被 传递 时 更 容易 


党 


对 于 结构 体 的 成 员 , 在 
ISO C99 中 是 允许 这 
种 写法 的 。 


char color_name[][6] = { 一 一 数组 的 数组 
"red", 
"green", 
"blue", 

}; 


对 以 上 的 代码 进行 图 解 ( 参照 图 3-20 )， 








3-20 数组 的 数组 


以 上 两 种 情况 都 可 以 用 color_name[i] [j] 的 方式 对 数组 进行 访问 ,但 是 




















内 存 中 数据 的 布局 是 完全 不 同 的 。 





3.6.3 ”声明 


只 有 在 声明 函数 的 形 参 的 时 候 ， 数 组 的 声明 才能 解读 成 指针 的 声明 ( 


有 照 3.5$.1 节 )。 








中 


以 上 的 语法 糖 ， 与 其 说 使 C 变 得 更 加 容易 理解 ， 倒 不 如 说 它 使 C 语言 的 























语法 变 得 更 加 混乱 。 是 不 是 有 很 多 人 这 么 想 ? 我 就 是 其 中 的 一 个 。 而 
的 说 明 更 是 使 这 种 混乱 局 面 雪上 加 霜 。 








H K&R 


在 不 是 声明 函数 的 形 参 的 时 候 ， 数 组 声明 和 指针 的 声明 是 不 可 能 相等 的 。 





使 用 extern 的 时 候 是 最 容易 出 现 问题 的 (参照 3.5.2 节 )。 另 外 ， 
部 变量 或 者 结构 体 的 成 员 时 ， 写 成 


int hoge[]; 


会 引起 语法 错误 。 





声明 局 


存在 数组 初始 化 表达 式 的 情况 下 ， 可 以 使 用 空 的 [] ， 但 这 是 因为 编译 器 














能 够 计算 出 数组 元 素 的 个 数 ， 所 以 可 以 省 略 书写 元 素 个 数 。 仅 此 而 已 ， 这 种 


特征 和 数组 扯 不 上 任何 关系 。 


要 点 
【 非常 重要 !! 】 
数组 和 指针 是 不 同 的 事物 。 


Vdd 


一 


下 
数组 和 指针 的 常用 方法 


4.1 基本 的 使 用 方法 


4.1.1 以 函数 返回 值 之 外 的 方式 来 返回 值 
这 种 手法 其 实 已 经 在 1.2.6 节 中 说 明 过 ， 本 节 让 我 们 回头 再 总 结 一 下 。 
在 C 中 ， 可 以 通过 函数 返回 值 。 可 是 ， 孙 数 只 能 返回 一 个 值 。 


在 大 型 的 程序 中 ， 经 常 需要 通过 返回 值 返回 程序 处 理 的 状态 〈 比如 是 否 
成 功 ， 如 果 失 败 ， 还 需要 返回 失败 的 原因 )。 


如 果 将 指针 作为 参数 传递 给 函数 ， 此 后 在 函数 内 部 对 指针 指向 的 对 象 填 
充 内 容 ， 就 可 以 从 函数 返回 多 个 值 。 

此 时 ,假设 需要 返回 的 数据 的 类 型 为 T， 参 数 的 类 型 就 成 为 “指向 工 的 
虽 针 ”。 

代码 清单 4-1 中 , 将 指向 int 和 double 的 指针 传递 给 函数 ， 此 后 在 函数 
内 部 对 这 两 个 指针 指向 的 变量 设 定 值 。 
















































































要 点 
如 果 需 要 通过 函数 返回 值 以 外 的 方式 返回 值 , 将 “指向 T 的 指针 ”( 如 果 想 
要 返回 的 值 的 类 型 为 T ) 作为 参数 传递 给 函数 。 
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代码 清单 4-1 output argument.c 





#include <stdio.h> 
void func(int x*a, double *b) 


米 己 
*b 


5 
3 


int main(Cvoid) 


int a; 
double b; 


户 记 
Oooovawm 和 wm 
cp 


func(&a, &b); 
printf("a..%d b..%f\n", a, b); 


return 0; 





户 户 户 记 ppPpp 
CONOUUAOWON 








4.1.2 将 数组 作为 函数 的 参数 传递 

本 节 的 内 容 在 1.3.6 节 中 也 进行 过 说 明 ， 这 里 再 做 一 次 总 结 。 

在 C 语言 中 ， 数 组 是 不 能 作为 参数 进行 传递 的 。 但 可 以 通过 传递 指向 数 
组 初始 元 素 的 指针 ， 使 得 在 函数 内 部 操作 数组 成 为 可 能 。 

因此 ， 在 函数 这 一 侧 ， 通 过 

array[i] 


这 种 方式 ， 就 可 以 引用 数组 的 内 容 。 因 为 在 本 质 上 ，array[i] 只 不 过 是 


*(array + 1 的 语法 糖 

代码 清单 4-2 中 ， 将 数组 array 传递 给 func()， 之 后 在 funcQ 〇 内 部 将 
array 的 内 容 输 出 。 

func() 还 以 参数 size 来 接收 数组 array 的 元 素 个 数 , 这 是 因为 array 只 是 
一 个 指针 ， 所 以 funcG) 并 不 知道 调用 方 数组 的 元 素 个 数 。 

mainG) 中 array 的 类 型 是 “int 的 数组 ”， 因 此 , 在 16 行 可 以 用 sizeof 
运算 符 取 得 数组 元 素 的 个 数 。 


可 是 ,在 funcGO 中， 参数 array 的 类 型 是 “指向 int 的 指针 ”， 即 使 使 
用 sizeof(Carray) ， 取 出 来 的 也 只 是 指针 自身 的 大 小 。 
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当然 ， 我 们 可 以 模仿 字符 串 的 做 法 一 一 在 数组 的 末尾 都 加 上 "\0'" ， 通 过 
在 函数 内 部 检索 '\0' ， 就 可 以 计算 出 字符 串 中 的 字符 个 数 。 





代码 清单 4-2 ”将 数组 作为 参数 传递 














1: #include <stdio.h> 
2: 
3: void func(int *array, int size) 
4: { 
5 : int i; 
6: 
ye for (1 = 0; 1 < size; i++) { 
8: printf(C"array[%d]..%d\n", 1i, array[i]); 
9: } 
10: } 
11: 
12: int main(void) 
13: { 
14: int array[] = {1, 2, 3, 4, 5}; 
15: 
16: func(array, sizeof(array) / sizeof(int)); 
17: 
18: return 0; 
19: } 
要 点 


想 要 将 类 型 T 的 数组 作为 参数 进行 传递 ， 可 以 考虑 传递 “指向 T 的 指针 ”。 
可 是 ， 作 为 被 调用 方 是 不 知道 数组 的 元 素 个 数 的 ， 所 以 在 必要 的 情况 下 ， 
需要 使 用 其 他 方式 进行 参数 传递 。 


4.1.3 可 变 长 数组 
一 般 情况 下 , C 语 言 在 编译 时 必须 知道 数组 的 元 素 个 数 , 但 是 也 可 以 使 用 
mallocQ 〇 在 运行 时 再 为 数组 申请 必要 的 内 存 区 域 。 
这 种 数组 ， 在 本 书 中 被 称 为 可 变 长 数组 。 # 虽然 我 们 经 党 这 么 叫 ， 
es ee ve 二 本 但 是 不 能 因此 就 认为 
代码 清单 4-3 中 ,首先 让 用 户 输入 需要 的 内 存 大 小 (11~ 13 行 ), 在 第 15 这 是 最 常见 的 称呼 
行使 用 mallocQ 〇 分 配 数组 所 需 的 内 存 区 域 ( 省略 对 返回 值 的 检查 )。 


第 17 ~ 19 行 ， 给 数组 赋值 ， 并 且 在 20 ~ 22 行 输出 数组 的 内 容 。 
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代码 清单 4-3 variable array.c 





1: #include <stdio.h> 

2: #include <stdlib.h> 

3 : 

4: int main(Cvoid) 

5: {£{ 

6: char buf[256]; 

7: int size; 

8 : int *variable_array; 
9: int 有 过 
10 
11: printf("Input array size>"); 
12: fgets(buf, 256, stdin); 
13 : sscanf(buf, "%d", &size); 
14: 
15: variable_array = malloc(sizeof(int) * size); 
16 : 
17: for (i = 0; 1 < size; i++) { 
18 : variable_array[i] = i; 
19 : } 
20 : for (i = 0; 1 < size; i++) { 
21: printf("variable_array[%d]..%d\n", i, variable_array[i]); 
22: } 
已 
24: return 0; 
25: } 

















如 果 想 要 修改 已 经 分 配 了 的 可 变 长 数组 的 大 小 , 你 可 以 使 用 reallocO) 。 


代码 清单 44 中 ,每 当 用 户 输 入 一 个 int 类 型 的 值 , 程序 都 会 使 用 reallocO 
扩展 variable_array 的 内 存 区 域 (这 里 也 省 略 了 对 返回 值 的 检查 )。 





代码 清单 4-4 realloc.c 








1: #include <stdio.h> 

2: #include <stdlib.h> 

3: 

4: int main(Cvoid) 

S50 泛 

6 : int *variable_array = NULL; 

7: int size = 0; 

8 : char buf[256]; 

9: int 及 
10 
11: while (fgets(buf, 256, stdin) != NULL) { 
12: SiZe++; 
13 : variable array = realloc(variable array, sizeof(int) * size); 
14: sscanf(buf, "%d", &variable_array[size-1]); 
15 : } 
16 : 
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17: for (1 = 0; 1 < size; i++) { 

18: printfC"variable_array[%d]..%d\n", i, variable array[i]); 
19: } 

20: 

21: return 0; 

2 








必须 要 引起 注意 的 是 ,在 使 用 mal1loc 〇 实现 可 变 长 数组 的 时 候 ， 程序 员 
必须 自己 来 管理 数组 的 元 素 个 数 。 


这 和 在 将 数组 作为 参数 进行 传递 时 ， 被 调用 方 无 法 知道 数组 长 度 的 理由 
一 样 一 一 mal1loc() 得 到 的 不 是 数组 ， 而 是 指针 。 


要 点 

在 需要 获得 类 型 和 的 可 变 长 数组 时 , 可 以 使 用 malloc() 来 动态 地 给 “指向 T 
的 指针 ”分 配 内 存 区 域 。 

但 此 时 需要 程序 员 自 己 对 数组 的 元 素 个 数 进行 管理 。 











补 
Ty, 充 Java 的 数组 


杰 书 是 C 的 参考 书 ， 在 这 里 提 到 Java 的 数组 只 是 给 大 家 做 一 个 参考 。 
Java 中 的 数组 只 能 使 用 内 存 堆 区 域 。 在 C 的 函数 中 写成 下 面 这 样 : 
int hoge[10] ; 
在 大 多 数 处 理 环 境 中 ， 数 组 本 身 是 分 配 在 栈 中 的 。Java 不 能 写成 上 面 这 样 ， 
而 应 该 写成 下 面 这 样 : 
int[] hoge = new int[10] ; 


new 相当 于 C 的 malloc() ,上面 的 Java 语句 和 下 面 的 C 语 名 具有 几乎 
相同 的 意义 ， 


int *hoge = malloc(sizeof(int) * 10); 


因此 ， 在 Java 中 经 常 使 用 指针 引用 数组 。 比 如 ， 使 用 下 面 的 方式 进行 
数组 的 赋值 : 


int[] hoge = new int[10] ; 
int[] piyo = hoge; 


如 图 4-1 所 示 ， 这 里 的 hoge 和 piyo 都 是 指向 数组 实体 的 指针 变量 。 
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* 这 里 为 什么 不 是 hoge. 
length()， 也 是 Java 
的 一 个 谜团 ,明明 可 以 
通过 length() 获得 
String 的 长 度 。 


尚 若 要 实现 array. 
setSize(newSize) 这 
样 的 功能 ,一旦 调用 
realloc() ， 地 址 就 会 
发 生变 化 ， 因 此 ， 通 过 
使 用 指针 或 者 句柄 进 
行 间接 引用 ， 来 实现 
VM 以 外 的 VM， 是 一 
件 难 度 很 高 的 事 
情 ...…... 莫非 是 因为 这 
个 原因 ? 


千 别 是 在 通用 性 不 太 
好 的 Java 中 ， 集 合 类 
库 (Collection Library ) 
提供 的 功能 并 不 能 完 
全 满足 需要 。 








可 是 , Java 的 数组 和 在 C 中 使 用 malloc() 分 配 的 数组 ， 有 决定 性 的 不 
同 : Java 的 数组 是 知道 自身 的 长 度 的 。 因 此 ， 对 于 


int[] hoge = new int[10] ; 
使 用 hoge.1ength， 可 以 知道 数组 的 长 度 为 10 。 


数组 





图 4-1 将 Java 的 数组 赋 给 变量 


此 外 ， 尽 管 Java 的 数组 是 保存 在 堆 中 的 ， 但 却 不 能 改变 长 度 ， 它 没有 


类 似 于 C 的 realloc() 这 样 的 函数 。 在 很 多 Java 语 法 的 疑 园 中 ， 这 一 点 万 
其 让 我 感到 费解 。 真 是 太 不 方便 了 ! 


4.2 组 合 使 用 


4.2.1 可 变 长 数组 的 数组 


证 我 们 考虑 开发 一 个 管理 “今天 的 标语 ”的 程序 。 


周一 的 标语 是 “日 行 一 善 "， 周 二 的 标语 “ 常 回 家 看 看 ”， 等 等 。 哈 哈 ， 
是 不 是 太 说 教 了 ? 


一 周 有 7 天 ， 这 是 不 会 变化 的 。 但 是 ， 标 语 的 字数 是 相互 不 同 的 。 对 于 
“ 勿 以 善 小 而 不 为 "， 中 文 " 的 一 个 汉字 为 2 个 字 节 ， 末 尾 加 上 "'\0'， 就 是 15 
个 字 节 ; 对 于 “ 常 回 家 看 看 ”， 就 是 11 个 字 节 。 此 时 ， 如 果 按 照 最 长 标语 的 字 
数 声明 一 个 二 维 数组 ， 就 避免 不 了 浪费 一 些 内 存 。 
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日语 汉字 ”， 日 语 汉字 的 一 个 字 的 长 度 也 是 2 个 字 节 。 一 一 译 者 注 
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此 外 ， 为 了 让 用 户 可 以 自由 地 修改 每 天 的 标语 ， 会 考虑 使 用 配置 文件 ， *# 一 般 也 是 这 样 的 吧 。 
所 以 标语 的 最 大 长 度 我 们 是 无 法 预测 的 。 

因为 标语 的 长 度 是 可 变 的 ,使 用 “char 的 可 变 长 数组 ”应 该 是 一 个 很 好 
的 选择 。 也 就 是 说 ,一周 的 标语 可 以 放 在 “char 的 可 变 长 数组 的 数组 ( 元 素 
个 数 7》 中 (参照 图 4-2 )。 
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图 4-2 一 周 的 标语 


可 以 像 下 面 这 样 进行 声明 : 

char *slogan[7]; 

实现 可 变 长 数组 的 时 候 ， 一般 需要 开发 者 自己 管理 元 素 的 个 数 。 但 是 此 
时 保存 的 是 字符 串 ， 字 符 串 必然 是 使 用 空 字符 结束 的 ， 所 以 不 需要 保持 元 素 
个 数 (在 需要 知道 元 素 个 数 时 ， 可 以 计算 获得 )。 

如 果 从 配置 文件 中 读 取 一 周 的 标语 , 程序 应 该 就 像 代码 清单 4-5 这 样 ( 这 
里 省 略 了 对 mallocO 〇 返回 值 的 检查 )。 












































代码 清单 4-5 read_slogan.c 





#include <stdio.h> 

#include <stdlib.h> 

#include <string.h> 

void read_slogan(FILE *fp, char **slogan) 


char buf[1024]; 
int 1; 


NOUUAWDNTOPp 
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* 汉字 都 是 2 个 字符 ,所 
以 通过 “第 nn 个 字符 ” 
可 能 是 取 不 出 某 个 汉 
字 的 。 这 里 姑且 让 我 们 
先 忽视 掉 这 个 问题 吧 
@, 请 暂时 把 它们 当成 
英语 的 标语 。 


8: 

9: for (i = 0; 1 < 7; i++) { 

10: fgets(buf, 1024, fp); 

11: 

12: /* 删 除 换行 字符 */ 

13 : buf[strlenCbuf)-1] = '\0'; 
14: 

15: /* 分 配 保 存 一 个 标语 的 内 存 空间 */ 
16 : slogan[i] = malloc(sizeof(char) * (strlen(buf) + 1)); 
17: 

18: /* 复 制 标 语 的 内 容 */ 

19 : strcpy(slogan[i], buf); 

20 : } 

213 才 

22: 

23: int main(Cvoid) 

24: { 

25: char *slogan[7] ; 

26:: int 1; 

2 

28 : read_slogan(stdin, slogan); 
29 : 

30: /* 输 出 读 取 的 标语 */ 

31: for (i = 0; 1 < 7; i++) { 

323 printf("%s\n", slogan[i]); 
33: } 

34: 

35: return 0; 

36: } 








代码 清单 4.5 中 ,从 标准 输入 读 取 一 周 的 标语 ,之 后 再 将 其 输出 (第 31 
33 行 )。 
在 程序 中 ,通过 slogan[i] 可 以 取出 指向 每 条 标语 的 初始 字符 的 指针 ， 
如 果 要 取出 标语 第 n 个 字符， 就 写成 下 面 这 样 : 

slogan[i][n] 

slogan 不 是 多 维 数组 ( 数组 的 数组 )， 其 内 存 布 局 完全 不 同 于 多 维 数组 。 

对 于 下 面 的 多 维 数组 的 声明 ， 

int hoge[10] [10] ; 


hoge[ 订 的 类 型 是 “int 的 数组 (元 素 个 数 10)”。 因 为 在 表达 式 中 数组 可 以 解 
读 成 指针 ，hoge[ 订 就 成 为 “指向 int 的 指针 ”， 所 以 可 以 通过 hoge[i][j] 
引用 到 数组 的 内 容 。 


对 于 slogan，slogan[i] 从 一 开始 就 是 指针 ， 所 以 还 是 可 以 写成 
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slogan[i] [n] 这 样 。 


此 外 ,通过 第 6 行 的 代码 ， 我 们 能 够 发 现 标语 的 最 大 长 度 限 制 为 1024 个 
字 贡 。 








既然 是 “char 的 可 变 长 数组 ”, 为 什么 不 取消 对 标语 长 度 的 限制 
呢 ? 如 果 无 论 如 何 都 要 添加 限制 ， 那 么 当初 用 多 维 数组 就 好 了 ……… 


抱 有 上 面 想法 的 人 请 做 一 下 下 面 的 思考 。 对 于 多 维 数 组 , 如 果 同 样 也 加 上 “最 
大 1024 个 字符 ”的 限制 ， 声 明 如 下 ， 


char slogan[7][1024]; 


此 时 ， 内 存 消耗 为 7x 1024 个 字符 。 可 是 在 代码 清单 4-5 中 ， 读 取 1024 个 字 
符 时 使 用 一 个 临时 缓冲 区 就 解决 问题 了 。 而 且 ， 由 于 这 个 数组 是 自动 变量 ， 
所 以 ，read_s1logan() 执 行 结束 时 这 个 缓冲 区 就 会 释放 "。 这 种 方式 下 ， 尽 管 
有 字符 数 的 限制 。 但 是 这 个 限制 是 非常 宽松 的 ， 从 使 用 效果 上 来 看 ， 这 个 方 
式 还 是 非常 实用 的 。 

可 是 在 某 些 情况 下 ， 这 种 对 字符 数 做 出 的 限制 ， 还 是 会 让 人 感觉 不 便 ， 
此 时 , 可 以 使 用 mall1oc0) 动 态 分 配 读 取 字 符 用 的 临时 缓冲 区 。 如 果 空 间 不 足 ， 
再 考虑 通过 realloc() 进 行内 存 区 域 扩展 。 


代码 清单 4-6 就 是 实现 了 可 以 读 取 任意 长 度 的 行 的 例 程 。 










































































代码 清单 4-6 read line.c 





1: #include <stdio.h> 

2: #include <stdlib.h> 

3: #include <assert.h> 

4: #include <string.h> 

5: #define ALLOC_SIZE (256) 

6: 

7: /* 

8: ”* 读 取 行 的 缓冲 ， 必 要 时 进行 扩展 。 但 是 区 域 不 会 被 缩小 。 
9: * 调 用 free_buffer(《) 释 放 。 

10: */ 

11: static char *st_line_buffer = NULL; 

12: 

13: /* 

14:  * 在 St_1ine_buffer 前 方 被 分 配 的 内 存 区 域 的 大 小 。 
15: */ 

16: static int st_current_buffer_size = 0; 

17: 

18: /* 





19:  * st_l1ine_buffer 中 现在 保存 的 字符 的 大 小 。 





水 


党 


也 有 一 些 处 理 环境 中 
栈 空间 的 大 小 是 固定 
的 , 而 且 也 非常 小 。 这 
种 情况 下 , 如 果 使 用 自 
动 变量 声明 特别 大 的 
数组 ,有 时 会 发 生 栈 溢 
出 问题 。 





顺便 介绍 一 下 ，GNU 
的 编程 标准 中 ,取消 了 
对 这 种 方式 的 限制 
( http://www.sra.co.jp/ 
public/sra/product/wing- 
nut/standards-j.html )。 
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20 : */ 

21: static int st_current_used_size = 0; 

22: 

23: /* 

24: # 如 有 必要 ， 扩 展 St_1ine_buffer 前 方 的 内 存 区 域 。 

25: ”* 在 St_1ine_buffer 末尾 追加 一 个 字符 。 

26: */ 

27: static void 

28: add_character(int ch) 

29: { 

30: /* 

3: * 此 也 数 每 次 被 调用 ，St_current_used_size 都 必定 会 增加 1， 
32: * 正 常 的 情况 下 ， 下 面 的 断言 肯定 不 会 出 错 。 

33: */ 

34: assert(st_current_buffer_size >= st_current_used_size); 
35: 

36: /* 

37: * St_current_used_size 达到 st_current_buffer_size 的 时 候 ， 
38: ** 扩 展 缓冲 区 的 内 存 区 域 。 

39: */ 

40: if (st_current_buffer_size == st_current_used size) { 
41: st_line_buffer = realloc(st_line_buffer, 
42: (st_current_buffer_size + ALLOC_SIZE) 
43: * sizeof(char)); 
44: st_current_buffer_size += ALLOC_SIZE; 

45 : } 

46: /# 在 缓冲 区 末尾 追加 一 个 字符 #/ 

47 : st_line_buffer[st_current_used_size] = ch; 
48: st_current_used_size++; 

49: } 

50 : 

51: /* 

52: ”* 从 fp 读 取 一 行 字 符 ， 一 旦 读 到 文件 末尾 ， 就 返回 NULL。 
53: */ 

54: char *read_line(FILE *fp) 

553 :4 

56: int ch; 

57: char *ret; 

58: 

59: st_current_used_size = 0; 

60 : while ((ch = getc(fp)) != EOF) { 

61: if (ch == '\n') { 

62: add_character('\0'); 

63: break; 

64: } 

65: add_character (ch); 

66: } 

67: if (ch == EOF) { 

68: if (st_current_used_size > 0) { 

69: /* 如 果 最 终 行 后 面 没有 换行 */ 

70 : add_character('\0'); 
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} else { 
return NULL; 
} 
} 
ret = malloc(sizeof(char) * st_current_used_size); 
strcpy(ret, st_line_buffer); 
return ret; 
} 
/* 


# 释 放 缓 冲 区 内 存 。 其 实 即 使 不 调用 这 个 函数 也 不 会 有 什么 问题 ， 


* 但 对 于 那些 抱 有 “程序 结束 时 ， 最 好 使 用 free() 释 放 掉 mal1loc() 分 配 的 内 存 
区 域 ” 这 种 想法 的 人 ， 
* 可 以 调用 这 个 总 数 。 
*/ 
void free_buffer(void) 
{ 


free(st_line_buffer); 
st_line_buffer = NULL; 
st_current_buffer_size = 0; 
st_current_used_size = 0; 








代码 清单 4-7 read line.h 








(‘OooNOUUAWODNTDPp 


#ifndef READ_LINE_H_INCLUDED 
#define READ_LINE_H_INCLUDED 


#include <stdio.h> 


char *read_line(FILE *fp); 
void free_buffer(void); 





#endif /* READ_LINE_H_INCLUDED */ 





rea 





d_1ine() 将 读 取 的 一 行 字 符 作为 返回 值 返 回 ( 删除 了 换行 字符 )。 如 




















果 读 到 了 文件 末尾， 返回 NULL。 


在 read_1ine() 中 ,指针 st_1ine_buffer" 指 向 缓冲 区 的 初始 位 置 ， 该 


缓冲 区 月 
ALLOC _S 





日 于 存放 临时 读 取 的 字符 。 当 缓冲 区 空间 不 足 时 ， 绥 冲 区 会 被 扩展 
IZE 大 小 的 区 域 . 其 实 使 用 这 种 方式 ,由 于 非常 频繁 地 调用 real1ocO) ， 








会 降低 程序 运行 效率 ， 同 时 也 带 来 内 存 碎 片 化 的 风险 (参照 2.6.5 节 )。 
一 旦 读 到 行 末 ， 该 函数 会 跟 据 当前 行 的 大 小 重新 分 配 内 存 区 域 ( 第 76 行 )， 








x* 对 于 生命 周期 为 “文件 
内 ”的 static 变量 ， 
我 一 般 习 惯 加 上 前 缀 


St_。 
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* 这 种 方法 中 使 用 了 
static 变量 ,所 以 不 是 
可 重 入 的 (reentrant )。 
多 线程 的 情况 下 ,也 会 
出 现 问题 只 要 不 在 这 
些 情况 下 ,这 种 方式 还 
是 很 有 效 的 。 


然后 将 st_1ine_buffer 的 内 容 复 制 到 此 内 存 区 域 。 因 为 下 一 次 的 调用 还 会 
使 用 缓冲 区 ， 所 以 此 时 无 需 释放 st_1ine_buffer 。 


因为 st_1ine_buffer 只 会 伸 长 不 会 缩短 ， 所 以 每 次 st_1ine_buffer 
只 会 消费 至 今 为 止 读 取 的 最 长 的 行 的 大 小 ( +a )。 不 管 怎么 说 也 就 是 这 一 个 内 
存 区 域 用 于 缓冲 ， 所 以 不 去 管 它 也 不 会 出 什么 问题 。 对 于 抱 有 “程序 结束 时 ， 
最 好 使 用 free() 释 放 掉 mal1ocGO) 分 配 的 内 存 区 域 ”这 种 想法 的 人 ， 可 以 在 
最 后 调用 free_buffer。 


read_1ine() 中 ， 因 为 通过 mallocO 分 配 了 字符 串 所 需要 的 内 存 区 域 ， 
所 以 一 旦 使 用 结束 必须 在 调用 方 使 用 freeG) 释 放 所 分 配 的 内 存 区 域 。 


Char *str; 
























































str = read_line(fp); 
/* 一 系列 处 理 */ 
free(str); 一 一 一 旦 终止 使 用 就 释放 | 


此 外 , 我 们 在 代码 清单 4-6 中 省 略 了 对 返回 值 的 检查 。 其 实 对 于 可 以 通用 
的 函数 ， 应 该 切实 做 好 返回 值 的 检查 工作 。 因 此 ， 在 4.2.4 节 中 提供 了 这 方面 
的 例 程 。 


4.2.2 可 变 长 数组 的 可 变 长 数组 

4.2.1 节 中 使 用 可 变 长 数组 来 表现 一 个 标语 ， 但 标语 的 个 数 固定 为 一 周 的 
天 数 (7 个 )。 

如 果 需 要 在 内 存 中 加 载 任意 行 数 的 文本 文件 ， 可 以 考虑 使 用 “可 变 长 数 
组 的 可 变 长 数组 ”( 参照 图 4-3 )。 

“类 型 的 可 变 长 数组 ”是 通过 “指向 的 指针 ”来 实现 的 (但 是 元 素 个 
数 就 需要 自己 来 管理 )。 
因此 ， 如 果 需 要 “T 的 可 变 长 数组 的 可 变 长 数组 "， 可 以 使 用 “指向 工 的 
者 针 的 指针 ”( 参照 图 4-3 )。 
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指向 T 的 指针 的 指针 


代码 清单 4-8 中 , 从 标准 输入 读 取 文 本 文件 的 内 容 , 并 且 将 其 用 于 标准 输 











LL 
画面 面 图 


图 4-3 可 变 长 数组 的 可 变 长 数组 




















出 。 为 了 读 取 任意 长 度 的 行 ， 这 里 使 用 了 代码 清单 4-6 的 函数 read_1ine()。 


代码 清单 4-8 read file.c 








coco、 上 请 


#include <stdio.h> 
#include <stdlib.h> 
#include <assert.h> 


#define ALLOC_SIZE (256) 


#include "read_line.h" 


char *x*xadd_line(char x**text_data, char *line, 
int x*line_alloc_num, int *1line_num) 
{ 
assert(*line_alloc_num >= *1ine_num); 
if (x*line_alloc_num == *]ine_num) { 
text_data = realloc(text_data, 


(x*line_alloc_num + ALLOC_SIZE) 


* Sizeof(char*x)); 
*1line_alloc_num += ALLOC_SIZE; 
} 
text_data[xline_num] = line; 
(x1ine_num)++; 


return text_data; 
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# 很 多 UNIX 环境 将 指 
向 环境 变量 的 指针 作 
3 个 参数 传递 ,其 


4 


这 并 不 符合 


标准 。 


2 

26: char **read_file(FILE x*fp, int *]1ine_num_p) 
27" 直 

28 : char **text_data = NULL; 

29 : int line_num = 0; 

30: int line_alloc_num = 0; 

31: char *1ine; 

32: 

33: while ((line = read_line(fp)) != NULL) { 
34: text_data = add_line(text_data, line, 
3 &line_alloc_num, &line_num); 
36: } 

37: /* 将 text_data 缩小 到 实际 需要 的 大 小 */ 

38: text_data = realloc(text_data, line_num * sizeof(char*)); 
39: *#]ine_num_p = line_num; 

40 : 

41: return text_data; 

42: 了 

43 : 

44: int mainCvoid) 

45: {{ 

46: char **text_data; 

47: int line_num; 

48: int i; 

49: 

50 : text_data = read_file(stdin, &line_num); 
51: 

52 : for (i = 0; 1 < line_num; i++) { 

53: printf("%s\n", text_data[i]); 

54: } 

DD 

56 : return 0; 

57: } 








因为 不 读 到 文件 的 最 后 就 无 法 知道 总 共 的 行 数 , 所 以 在 read_file() 中 ， 
对 于 指针 数组 也 使 用 rea11oc(0) 顺 序 地 将 0 s 间 加 长 。 


read_1ine() 中 ,为 了 共享 一 些 变量 , 使 用 了 文件 内 的 static 变量 。 但 
这 里 使 用 了 通过 参数 传递 指针 的 方式 。 通 过 文件 内 的 static 变量 和 全 局 变量 
共享 数据 时 ， 因 为 无 法 知道 “ 值 在 什么 地 方 被 改写 "， 所 以 在 很 多 情况 下 通过 
参数 传递 指针 的 方式 显得 很 有 效 。 

















4.2.3 他 命令 行 参数 


正如 1.2 节 中 说 明 的 那样 ， 对 于 main 函数 ， 标 准 中 指出 必须 要 写成 下 面 
两 种 形式 的 中 的 一 种 。 


int main(Cvoid) 一 一 中 
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或 者 


int main(int argc, char x*argv[]) <— © 


直到 现在 ， 我 们 还 


取得 命令 行 的 参数 。 





一 直 使 用 第 中 种 形式 ， 如 果 使 用 第 @ 种 形式 ， 还 可 以 





比如 ，UNIX 中 的 cat 命令 一 一 它 用 于 输出 文件 的 内 容 。 


像 下 面 这 样 : 

cat hoge.txt 
命令 名 后 是 想 要 输 生 
起 来 : 


cat hoge.txt pi 








1 的 文件 名 。 如 果 像 下 面 这 样 将 多 个 文件 名 作为 参数 排列 


yo.txt 





输出 就 是 将 hoge.txt 和 piyo .txt 两 个 文件 的 内 容 连 接 后 所 得 的 结果 ”。 

其 实 , 事先 是 无 法 知道 cat 有 几 个 参数 的 。 不 仅 如 此 ， 各 参数 (文件 名 ) 
所 对 应 文件 的 长 度 也 无 法 预测 。 因 此 ， 这 些 参数 可 以 使 用 “char 的 可 变 长 数 
组 的 可 变 长 数组 ”、“ 指 向 指针 的 指针 ”来 表现 。 





对 于 刚才 的 main 








函数 的 第 @@ 种 形式 , 它 其 实 和 下 面 这 种 形式 是 完全 一 样 的 ， 


int main(int argc, char **argv) 
你 既然 读 到 这 了 ， 我 想 应 该 能 明白 这 是 为 什么 。 
argv 在 内 存 中 的 结构 ， 如 图 4-4 所 示 。 


argv 


这 里 的 个 
数 为 argc 





古 殴 各国 
Et | Se 





图 4-4 argvz 的 结构 


* DOS 中 使 用 type 命 
邻 ,但 是 ,DOS 的 type 
命令 不 具备 文件 的 连 
接 功 能 (可 以 使 用 
copy 命令 )。 


* Cat 是 concatenate( 连 


接 ) 的 简写 。 


# 不 理解 的 同学 ,请 再 次 
阅读 3.5.1 节 
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， UNIX 中 可 以 通过 党 argv[0] 中 保存 了 命令 名 自身 。 在 程序 输出 错误 提示 信息 时 "， 或 者 需要 
道 将 命令 连接 起 来 执 通过 命令 名 称 改 变 程序 的 行为 时 会 经 常 使 用 argVv [0] o 

在 信 玫 下 二 个 时。 argc 中 保存 了 参数 的 个 数 (包含 了 argv[0] ). 实际 上 , 从 ANSIC 之 后 ， 

人 下 会 保证 argv[argc] 肯 定 为 NULL， 所 以 完全 可 以 没有 argc, 但 是 目前 仍然 还 


提示 某 个 命令 自身 的 
人 已 定义 有 很 多 人 习惯 性 地 引用 argco 


es 代码 清单 49 是 UNIX 的 cat 的 简单 实现 。 
和 UNIX 的 cat 一 样 ,如果 不 指定 参数 , 则 使 用 标准 输入 (第 14 ~ 15 行 )。 
第 20-27 行 ,在 for 循环 中 顺序 地 处 理 参数 指定 的 文件 名 。 


世间 有 很 多 人 在 此 时 ， 一 直 奖 固 地 拒绝 使 用 循环 计数 ， 他 们 宁愿 一 边 对 
argc 做 减法 运算 , 一 边 前 移 argv。 我 还 是 习惯 使 用 计数 器 ,然后 使 用 下 标 访 
问 ， 因 为 这 种 方式 很 容易 让 人 理解 。 

































































代码 清单 4-9 cat.c 











1: #include <stdio.h> 

2: #include <stdlib.h> 

3 

4: void type_one_file(FILE *fp) 

5 二 

6: int ch ; 

7 while ((ch = getc(fp)) != EOF) { 
8: putchar Cch); 

9: } 
10: } 
11: 
12: int main(int argc, char **argv) 
13: { 
14: if (argc == 1) { 
15: type_one_file(stdin); 
16 : } else { 
17: int i; 
18 : FILE *fp; 
19 : 
20 : for (i = 1; i < argci i++) { 
21: fp = fopen(argv[i], "rb"); 
2 这 2 if (fp == NULL) { 
23: fprintf(stderr, "%s:%s can not open.\n", 

argv[0], argv[i]); 

24: exit(1); 
5 } 
26 : type_one_file(fp); 
27: fclose(fp); 
28 : } 
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29 : } 

30 : 

31: return 0; 
32， 下 





4.2.4 ”通过 参数 返回 指针 


4.2.1 节 中 使 用 函数 read_1ine() (参照 代码 清单 4-6 )， 将 读 取 的 行 作为 
返回 值 返回 ， 如 果 到 达 文 件 的 终点 则 返回 NULL。 


可 是 ， 作 为 返回 值 的 形式 ，read_1ineG) 返 回 的 是 通过 ma11oc() 分 配 的 
内 存 区 域 。 代 码 清 单 4-6 中 并 没有 对 返回 值 做 检查 。 如 果真 的 想 要 让 
read_1ine() 成 为 通用 的 函数 ， 就 必须 好 好 地 对 返回 值 做 检查 ， 并 且 能 向 调 
用 方 返回 函数 的 处 理 状 态 。 


对 于 read_1ineG) 向 调用 方 返 回 的 处 理 状 态 ， 下 面 列 出 了 几 种 可 能 
状况 : 

@ 正常 地 读 取 了 1 行 。 

@ 读 到 了 文件 的 末尾 。 

@ 内 存 不 足 导 致 处 理 失 败 。 


将 这 些 状态 用 枚 举 类 型 来 表示 : 


typedef enum { 
READ_LINE_SUCCESS ， /* 正 常 地 读 取 了 1 行 */ 
READ_LINE_EOF, /* 读 到 了 文件 的 末尾 */ 
READ_LINE_OUT_OF_MEMORY /* 内 存 不 足 导 致 处 理 失 败 */ 
} ReadLineStatus; 


作为 向 调用 方 返回 处 理 状态 的 方式 ， 考 虑 像 下 面 这 样 通过 参数 返回 : 

char x*read_line(FILE *fp，ReadLineStatus *status); 

这 种 方案 是 非常 正确 的 ， 但 是 也 有 不 少 软件 项 目 选 择 坚持 “应 该 通过 返 
回 值 返 回 处 理 状态 ”的 观点 。 

但 是 ， 如 果 将 返回 值 用 于 表示 人 处理 状态 ， 那 么 当前 通过 返回 值 返 回 的 读 
取 到 的 字符 串 ， 就 必须 通过 参数 返回 。 

如 果 使 用 参数 返回 类 型 T， 可 以 使 用 “指向 工 的 指针 ”。 有 目前 我 们 想 要 返 
回 类 型 “指向 char 的 指针 ”, 所 以 参数 的 类 型 就 应 该 是 “指向 char 的 指针 的 
指针 ”。 
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因此 ， 函 数 的 原型 如 下 : 
ReadLineStatus read_line(FILE *fp，char *x*|]ine); 


代码 清单 410 为 修订 版 的 头 文件 ， 代 码 清单 4-11 是 实现 代码 。 








代码 清单 4-10 read line.h (修订 版 ) 








工 #ifndef READ_LINE_H_INCLUDED 

2 #define READ_LINE_H_INCLUDED 

3 

4 #include <stdio.h> 

5 

6: typedef enum { 

7 : READ_LINE_SUCCESS ， /* 正 常 地 读 取 了 1 行 */ 

8 : READ_LINE_EOF ， /* 读 到 了 文件 的 末尾 */ 

9 READ_LINE_OUT_OF_MEMORY /* 内 存 不足 导 致 处 理 失败 */ 
10 } ReadLineStatus; 
11 
12: ReadLineStatus read_line(FILE *fp, char *xline) ; 
13: void free_buffer(void); 
14: 
15: #endif /* READ_LINE_H_INCLUDED */ 








代码 清单 4-11 read line.c( 修订 版 ) 











1: #include <stdio.h> 

2: #include <stdlib.h> 

3: #include <assert.h> 

4: #include <string.h> 

5: #include "read_line.h" 

6: #define ALLOC_SIZE (256) 

7 : 

8: /* 

9: # 读 取 行 的 缓冲 ， 必 要 时 进行 扩展 。 但 是 区 域 不 会 被 缩小 
10: # 调 用 free_buffer() 释 放 ，。 
11: */ 
12: static char *st_line_buffer = NULL; 
13: 
14: /* 
15 : # 在 St_1ine_buffer 前 方 分 配 的 内 存 区 域 大 小 。 
16 : */ 
17: static int st_current_buffer_size = 0; 
18: 
19: /* 
20: x* St_1ine_buffer 中 现在 被 保存 的 字符 的 大 小 。 
21: */ 
22: static int st_current_used_size = 0; 
23 : 
24: /* 
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25 : 
26 : 
27 : 
28 : 
29 : 
30 : 
31: 
32: 
33 : 
34 : 
35 : 
36 : 
37 : 
38 : 
39 : 
40 : 
41: 
42: 
43: 
44: 
45: 
46: 
47: 
48: 
49: 
50: 
51: 
52 : 
53 : 
54: 
S55 
56: 
57: 
58: 
59: 
60: 
61: 


62: 
63: 
64: 
65: 
66: 
67: 
68: 
69: 
70 : 
71: 
72: 
73: 
74: 
75: 


# 在 St_1ine_buffer 末尾 追加 一 个 字符 。 
* 如 果 有 ' 必 要， 扩展 St_1ine_buffer 前 方 的 内 存 区 域 。 
*/ 
static ReadLineStatus 
add_character(int ch) 
{ 
/* 
六 此 函数 每 次 被 调用 ，Sst_current_used_size 都 必定 会 增加 工 。 
* 正 常 的 情况 下 ， 下 面 的 断言 肯定 不 会 出 错 。 
*/ 


assert(st_current_buffer_size >= st_current_used_size); 


/* 
# 当 St_current_used_size 达到 st_current_buffer_size 的 时 候 ， 
* 扩 展 缓冲 区 的 内 存 区 域 。 
*/ 
if (st_current_buffer_size == St_current_used_size) { 
char *temp; 
temp = realloc(st_line_buffer, 
(st_current_buffer_size + ALLOC_SIZE) 
* Ssizeof(char)); 
if (temp == NULL) { 
return READ_LINE_OUT_OF_MEMORY ; 





} 
st_line_buffer = temp; 
st_current_buffer_size += ALLOC_SIZE; 





} 

/* 在 缓冲 区 末尾 追加 一 个 字符 。*/ 
st_line_buffer[st_current_used_size] = ch; 
st_current_used_size++; 


return READ_LINE_SUCCESS ; 
} 


/* 
# 释 放 缓 冲 区 内 存 。 其 实 即 使 不 调用 这 个 函数 也 不 会 有 什么 问题 ， 
* 但 对 于 那些 抱 有 “程序 结束 时 ， 最 好 使 用 free() 释 放 掉 mal1oc() 分 配 的 
内 存 区 域 ”这 种 想法 的 人 ， 
* 可 以 调用 这 个 水 数 。 
*/ 
void free_buffer(void) 
{ 
free(st_line_buffer); 
st_line_buffer = NULL; 
st_current_buffer_size = 0; 
st_current_used_size = 0; 





} 


/* 
# 从 fp 读 取 一 行 字 符 ， 一旦 读 到 文件 末尾 ， 就 返回 NULL。 
*/ 
ReadLineStatus read_line(FILE *x*fp, char **|line) 
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76: { 
77: int ch ; 
78 : ReadLineStatus status = READ_LINE_SUCCESS; 
79: 
80: st_current_used_size = 0; 
81: while ((ch = getc(fp)) != EOF) { 
82: if (ch == '\n') { 
83: status = add_character('\0'); 
84: if (status != READ_LINE_SUCCESS) 
85: goto FUNC_END; 
86 : break ; 
87 : } 
88: status = add_character(ch); 
89 : if (status != READ_LINE_SUCCESS) 
90 : goto FUNC_END ; 
91: } 
92: if (ch == EOF) { 
93 : if (st_current_used_size > 0) { 
94: /* 如 果 最 终 行 后 面 没有 换行 */ 
95 : status =add_character('\0'); 
96 : if (status != READ_LINE_SUCCESS) 
97 : goto FUNC_END; 
98 : } else { 
99 : status = READ_LINE_EOF ; 
100 : goto FUNC_END ; 
101: } 
102 : } 
103: 
104: *xline = malloc(sizeof(char) * st_current_used_ size); 
105 : if (x*line == NULL) { 
106: status = READ_LINE_OUT_OF_MEMORY ; 
107: goto FUNC_END; 
108: } 
109 : strcpy(*1ine，st_line_buffer) ; 
110: 
111: FUNC_END : 
112 : if (status != READ LINE SUCCESS && status != READ LINE FEOF) { 
113: free_buffer(); 
114: } 
115: return Status ; 
116: } 











在 read_lineGO 中 , 一旦 mall1ocGO 返 回 NULL, 程序 马上 通过 goto 将 处 
理 转 移 到 FUNC_END。 


在 处 理 失 败 的 情况 下 , FUNC_END 调用 free_buffer() 来 释放 缓冲 区 
的 内 存 。 一 般 在 内 存 不 足 的 时 候 mallocO 才 会 发 生 错 误 ， 所 以 释放 掉 这 部 分 
内 存 ， 多 少 能 腾 出 一 些 空间 来 完成 后 面 的 处 理 ( 只 是 可 能 )。 





型 
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世上 有 很 多 主张 “禁用 goto” 的 教条 主义 者 ， 但 在 这 种 异常 处 理 中 ， 如 
果 不 用 goto， 反 而 会 让 程序 变 得 更 复杂 ` 。 
这 里 顺便 插 一 段 ， 曾 经 打响 “goto 威胁 论 ” 第 一 枪 的 Edsger W. Dijkstra 
老师 在 事后 说 了 这 么 一 段 话 (《 计 算 机 程序 设计 艺术 》 辐 p.41 )， 
对 于 我 的 禁用 goto 的 这 个 极端 片面 的 想法 ,还 是 希望 大 家 不 要 
掉 进 迷信 的 圈套 。 通 过 代码 写法 上 的 某 个 技巧 去 解决 程序 设计 上 的 
问题 ， 就 和 企图 创造 一 个 新 兴 宗 教 一 样 让 人 感到 不 快 。 
要 点 
异常 处 理 中 使 用 goto， 反 而 可 以 让 程序 更 加 整洁 。 


4.2.5 ”将 多 维 数 组 作为 函数 的 参数 传递 

在 C 中 ,其实 不 存在 多 维 数组 ， 看 上 去 貌似 多 维 数组 的 其 实 是 “数组 的 
数组 ”。 

将 类 型 的 数组 作为 参数 进行 传递 时 ， 可 以 传递 “指向 的 指针 ”( 参照 
4.12 节 )。 因此， 如果 想 要 将 “数组 的 数组 ”作为 参数 进行 传递 ,可 以 考虑 传 
递 “ 指 向 数组 的 指针 ”。 

在 代码 清单 4.12 中 ， 将 3 x4 的 二 维 数组 传递 给 函数 func() ， 然 后 在 
funcO 〇 中 将 其 内 容 输出 。 


















































代码 清单 4-12 pass 2d array.c 








1: #include <stdio.h> 

2: 

3: void func(int (*hoge)[3]) 

4: 荆 

5 : int i, j; 

6: 

7: for (i1 = 0; 1 < 4; i++) { 

8: for (j] = 0; j < 3; j++) { 
9: printf("%d, ", hoge[i][j]); 
10: } 
11: putchar('\n'); 
于 学 } 
13: } 
14: 

15: int main(Cvoid) 

16: { 

17: int hoge[][3] = { 

18: {1,， 2，3},， 





* 如 果 是 C++ 和 Java 这 
种 具备 异常 处 理 机 制 
的 语言 ,当然 可 以 不 使 
用 goto。 在 C 中 也 有 
setjmp()/1ongjmp()， 
使 用 它们 也 能 达到 相 
似 的 效果 。 
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# 但 是 ,元 素 个 数 需要 通 
过 别 的 方式 管理 。 


19 : {4，5，6}， 

20 : {7，8，91}， 
21: {10，11，12},， 
22: 于 

23 : 

24: func(hoge); 

9: 

26 : return 0; 

27: 了 











4.2.6 ”数组 的 可 变 长 数组 





假设 要 开发 一 个 支持 多 点 折线 ( 曲线 ) 的 画笔 工具 。 
考虑 使 用 可 变 长 数组 来 表现 多 点 折线 中 的 “点 "， 并 且 使 用 “double 的 











数组 (元素 个 数 2 )” 来 记录 一 个 “点 ”。 


因此 ， 多 点 折线 就 可 以 被 定义 成 : 


double 的 数组 (元 素 个 数 2) 的 可 变 长 数组 


可 以 使 用 “指向 类 型 了 的 指针 ”实现 “类 型 工 的 可 变 长 数组 ， 所 以 上 面 的 定 
义 可 以 变化 成 


指向 double 的 数组 (元 素 个 数 2) 的 指针 
因此 ， 分 配 多 点 折线 的 内 存 区 域 ， 可 以 写成 下 面 这 样 : 


double (x*polyline)[2]; < 一 polyline 是 指向 double 数组 (元 素 个 数 2) 的 指针 








/* npoints 是 构成 多 点 折线 的 坐标 的 个 数 */ 
polyline = malloc(sizeof(double[2]) * npoints) ; 


如 果 感 觉 理解 上 有 些 困难 ， 不妨 通过 下 面 的 方式 对 “double 的 数组 (元 








素 个 数 2 ”这 部 分 进行 类 型 定义 : 


typedef double Point[2]; 
此 时 ，ployline 的 声明 和 内 存 区 域 的 申请 可 以 写成 下 面 这 样 : 


Point x*polyline; < 一 polyline 是 指向 Point 的 指针 








polyline = malloc(sizeof(Point) * npoints); 
我 想 这 样 就 容易 理解 了 吧 。 
无 论 使 用 上 面 的 哪 种 方式 ， 第 个 点 的 和 坐标 都 写成 


polyline[i][0] 
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Y 坐标 都 写成 
polyline[i] [1] 


但 是 本 书 却 不 推荐 大 家 使 用 本 小 节 中 介绍 的 方法 ， 理 由 在 下 一 小 节 给 大 家 
说 明 [e 











4.2.7 ”纠结 于 “可 变 ” 之 前 ， 不 妨 考虑 使 用 结 
构 体 
在 42.6 节 中 ， 使 用 了 “指向 数组 的 指针 ”来 表现 多 点 折线 。 
假设 有 5 条 多 点 折线 ， 应 该 通过 什么 样 的 方式 来 管理 呢 ? 
“多 点 折线 ”是 “指向 double 的 数组 ( 元素 个 数 2 ) 的 指针 ”( 需要 自己 
管理 元 素 个 数 ) 因此 ， 如 果 是 “多 点 折线 的 数组 (元 素 个 数 5 ， 就 可 以 解 


释 为 “指向 double 数组 (元素 个 数 2 ) 的 指针 的 数组 ( 元 素 个 数 5 六 ， 声 
明 如 下 : 

double (x*polylines[5])[2]; 

你 既然 读 到 这 了 了 ， 应 该 可 以 很 轻松 地 读 懂 上 面 的 声明 吧 。 但 客观 地 说 ， 
这 个 声明 仍然 比较 复杂 。 

此 外 ， 因 为 有 5 根 折线 ， 所 以 对 于 每 根 折线 对 应 的 元 素 个 数 npoint ( 每 
根 折线 上 的 坐标 个 数 )， 就 需要 声明 为 以 下 数组 : 

int npoints[5]; 

如 果 不 是 5 根 , 而 是 将 任意 数量 的 “折线 ”作为 参数 来 接收 的 函数 原型 ， 
应 该 大 致 是 下 面 这 样 : 

func(Cint polyline_num, double (x*xx*polylines)[2], int *npoints); 


可 以 定义 一 个 Point 类 型 ; 


















































typedef double Point[2]; 

函数 原型 就 可 以 变 成 下 面 这 样 : 
func(Cint polyline_num, Point *x*polylines, int *npoints) ; 
如 果 顺 便 再 定义 下 面 的 类 型 ， 


typedef Point x*Polyline; 
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上 面 的 函数 原型 就 变 成 了 下 面 这 样 : 
funcCint polyline_num, Polyline *polylines, int x*npoints); 


尽管 使 用 typedef 可 以 简化 声明 ， 但 还 是 不 能 让 这 个 声明 变 得 更 加 容易 
理解 。 


但 要 说 最 不 尽 如 人 意 的 地 方 ， 那 还 是 “需要 程序 员 自 己 管理 数组 的 元 素 
个 数 ”这 件 事 吧 。 


索性 像 下 面 这 样 使 用 结构 体 来 定义 Point 吧 : 


typedef struct { 
































double 区 
double y; 
} Point; 


同样 地 ， 也 可 以 用 结构 体 定义 Polyline: 


typedef struct { 





int npoints; 
Point *point; 
} Polyline; 


将 npoints 和 point 进行 统一 管理 ,编程 工作 好 像 变 得 更 简单 ， 并 且 也 不 需 
要 做 “X 坐标 为 [0] ，Y 坐标 为 [1] ”这 样 的 暗喻 。 
在 CAD 这 样 的 应 用 中 , 需要 经 常 进行 坐标 的 行列 转换 。 对 于 Point 这 样 
的 结构 体 ， 就 要 使 用 循环 逻辑 来 回 倒 腾 数据 。 此 时 不 妨 考 虑 使 用 下 面 的 方式 : 
typedef struct { 
double coordinate[3]; 


} Point; 


其 实 ， 对 于 2D 的 画笔 程序 ， 具有 x，y 成 员 的 结构 体 就 已 经 够 用 了 。 











补 
名 充 什么 是 “宽度 ”可 变 的 二 维 数组 ? 


如 图 4-5 所 示 ，4.2.6 节 中 使 用 了 “ 定 长 数组 的 可 变 长 数组 ”。 

但 有 时 我 们 希望 在 运行 时 确定 数组 两 个 维度 的 大 小 。 

很 遗憾 ，C 语言 不 支持 这 种 使 用 数组 的 方式 。 正 如 已 经 说 明 过 的 那样 ， 
所 谓 C 语 言 的 二 维 数 组 ， 其 实 本 质 上 是 “数组 的 数组 ”。 为 了 引用 数组 的 元 
素 ，C 语 言 必 须 在 编译 时 就 确定 数组 元 素 的 类 型 大 小 。 
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这 一 侧 的 长 度 固定 




















图 4-5 定 长 数组 的 可 变 长 数组 


如 果 使 用 4.2.2 节 中 介绍 的 方法 ， 当 然 可 以 实现 如 图 4-6 这 样 的 “宽度 
可 变 的 三 维 数组 ”的 替代 品 。 


| 姿 齐 “宽度 ”分配 内 存 ,| 














图 4-6 ”宽度 可 变 的 二 维 数组 〈 替 代 品 ) 实现 1 





但 由 于 这 种 方式 需要 多 次 调用 malloc()， 所 以 在 效率 和 速度 上 都 不 会 
令 人 满意 。 此外, 过 多 的 malloc() 调 用 , 也 会 让 free() 的 调用 变 得 很 繁琐 。 
针对 这 个 问题 ， 可 以 将 malloc() 的 调用 限制 在 两 次 ， 如 图 4-7 这 样 将 

旨 针 进行 伸展 。 





图 4-7 宽度 可 变 的 二 维 数 组 〈 替 代 品 ) 实现 2 
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当然 ， 无 论 是 图 4-6 还 是 图 4-7， 在 引用 数组 的 内 容 的 时 候 都 可 以 写成 
array[i][j] 这 样 的 形式 。 

其 实 ， 现实 中 除了 拘泥 于 array[i] [j] 这 样 的 写法 ， 也 是 可 以 简单 地 
使 用 一 维 可 变 长 数组 ， 使 用 array[i * width + j] 来 引用 数组 的 内 容 ， 
这 也 许 是 最 省 事 的 方式 了 。 


补 
“Ty 充 Java 的 多 维 数组 


这 部 分 可 能 有 些 离 题 ， 让 我 们 来 谈 谈 Java。 

4.1 节 的 补充 内 容 “Java 的 数组 ”中 提 到 ，Java 经 常 使 用 指针 来 操作 数组 。 

此 外 ，Java 和 C 一 样 不 存在 多 维 数组 ， 也 是 使 用 数组 的 数组 来 实现 多 
维 数组 ( 替代 品 ), 但 是 ，Java 和 CC 不 同 的 是 ，Java 的 数组 都 是 指针 ， 所 以 
所 谓 的 “数组 的 数组 ”其 实 是 “指向 数组 的 指针 的 数组 ”。 

在 Java 中 ， 如果 使 用 二 维 数 组 来 表现 “二 维 多 点 折线 ” ,你 可 以 写成 下 
面 这 样 : 

// npPoints 为 坐标 的 个 数 

double[][] polyline = new int[nPoints] [2]; 


各 元 素 在 内 存 中 的 配置 如 图 4-8 所 示 。 


polyline 





图 4-8 Java 的 多 点 折线 二 维 数组 





你 可 以 将 polyline[1] 赋 给 polyline[0] ， 也 可 以 将 null 赋 给 


polyline[0]。 
顺便 介绍 一 下 ，Java 中 的 类 (相当 于 C 中 的 结构 体 ) 也 是 保存 在 堆 中 ， 
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并 且 只 能 利用 指针 进行 操作 。 因 此 ，Java 中 没有 类 似 C 中 “结构 体 的 数组 ” 
这 样 的 对 象 。 
在 4.2.7 节 中 ,没有 使 用 二 维 数组 而 是 使 用 了 结构 体 来 表现 多 点 折线 。 
如 果 使 用 Java 实现 ， 其 中 各 元 素 的 内 存 布 局 如 图 4-9 所 示 。 
polyline 


< 一 这 是 point 


国 


图 4-9 Java 的 多 点 折线 结构 体 ( 类) 


可 以 使 用 下 面 的 代码 构造 这 样 的 结构 : 

// nPoints 为 坐标 的 个 数 

Point[] polyline = new Point[nPoints]; 

for (int 1 = 0; 1 < npPoints; i++) { 

polyline[i] = new PointQO); 

其 实 阻碍 Java 程 序 快速 执行 的 最 大 原因 就 是 Java 过 多 地 使 用 了 堆 操作 。 

C++ 的 对 象 可 以 不 通过 指针 ， 而 是 通过 实体 来 操作 。 为 了 实现 这 个 特性 ， 
CH 使 用 了 带 参 数 的 构造 方法 以 及 继承 的 概念 ,导致 了 CH 编程 变 得 非常 复杂 。 


4.3 ”违反 标准 的 拉 巧 


4.3.1 可 变 长 结构 体 


在 4.2.7 节 中 ,使 用 了 下 面 的 方式 定义 了 多 点 折线 。 








typedef struct { 
int npoints; 
Point *point; 
} Polyline; 


* 关于 Java 过 多 地 进行 
堆 操 作 这 一 点 ,可 以 说 
是 面向 对 象 语言 的 必 
然 特 征 。 
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使 用 mallocO 〇 动态 地 为 Polyline 分 配 内 存 的 时 候 ， 需要 调用 两 次 
malloc() 一 一 两 次 在 堆 空 间 上 分 配 内 存 (参照 图 4-10 )。 


Polyline Point 的 数组 


Ee 二 


图 4-10 Polyline 的 实现 方法 1 
从 实现 方法 上 来 看 ， 其 实 这 样 做 也 是 非常 正确 的 。 但是， 对 于 malloc QO 
分 配 的 每 个 内 存 区 域 ， 通常 都 需要 一 些 额 外 的 管理 区 域 。 除 此 以 外 ， 内 存 碎 
片 化 也 是 一 个 问题 ( 请 参照 第 2 章 相 关内 容 )。 此 时 ， 不 妨 以 下 面 的 方式 声明 
Polyline 类 型 : 
































typedef struct { 


int npoints; 
Point point[1]; 
} Polyline; 


并 且 使 用 下 面 的 手法 进行 内 存 分 配 : 


Polyline *polyline; 





polyline = malloc(sizeof(Polyline) + sizeof(Point) * (npoints-1)); 


在 这 种 方式 下 ， 如 果 使 用 poly1ine->point[3] 进 行 引 用 ,会 发 生 越界 
引用 ， 因 为 Poly1ine 类 型 的 point 成 员 的 元 素 个 数 是 1。 好 在 大 部 分 的 C 
处 理 环境 都 不 做 数组 范围 检查 ， 你 可 以 使 用 mallocO) 在 Polyline 后 面 追加 
分 配 必要 的 内 存 空间 (参照 图 4-11 )。 














Polyline 





noonts 真正 的 Polyline 
point[0] 只 是 到 这 里 





即使 超出 了 数组 的 

















范围 写 入 数据 ,但 point[1] 
由 于 使 用 malloc QO point[2] 
为 超出 的 部 分 分 配 - 
空间 ， 所 以 一 般 情 pointE3] 
况 下 ,程序 也 能 很 point[4] 
好 地 执行 





图 4-11 ”Polyline 的 实现 方法 2 























通过 这 样 的 写法 ,结构 体 的 最 后 成 员 不 使 用 指针 也 可 以 直接 保存 可 变 长 
数组 , 这 种 ( 似乎 ) 可 以 让 结构 体 长 度 可 变 的 技巧 , 称 为 “可 变 长 结构 体 ”( 虽 








4.3 ”违反 标准 的 技巧 


189 








然 不 是 标准 称呼 )。 


此 外 ， 如 果 将 Polyline 类 型 的 成 员 point 声明 成 point[0] 这 样 , 在 
malloc() 的 时 候 就 不 需要 做 npoints - 1 这 样 的 调整 。 但 是 ANSI C 规定 了 
数组 的 元 素 个 数 必须 大 于 0。 虽然 也 有 处 理 环 境 (如 gcc 等 ) 允许 声明 元 素 个 
数 为 0 的 数组 ， 但 不 管 怎么 说 ， 这 只 是 个 别 实现 。 


可 是 ,可 变 长 结构 体 这 样 的 技巧 并 不 总 是 有 效 的 ,比如 , 想 要 增加 Polyline 

的 坐标 个 数 的 时 候 ， 对 于 Point 数组 ， 可 以 通过 real1ocO 扩 展 必 要 的 内 存 区 

域 。 但 对 于 可 变 长 结构 体 Poly1ine, 就 需要 整体 重新 分 配 内 存 区 域 , Polyline 

自身 的 地 址 发 生变 化 的 可 能 性 很 高 。 如 果 有 很 多 持 有 指向 Polyline 的 指针 的 
痢 针 变量 ， 必 须 对 它们 进行 全 部 更 新 。 这 事 儿 还 是 挺 麻烦 的 ! 


其 实 , “可 变 长 结构 体 ”这 样 的 技巧 , 如 果 用 于 将 结构 体 整体 保存 到 文件 ， 
或 者 通过 进程 间 通 信 、 网 络 等 条 件 进行 传输 ， 应 该 会 产生 不 错 的 效果 。 使 用 
fwriteGO 这 样 函数 将 内 存 中 的 结构 输出 的 时 候 ， 指 针 类 型 的 成 员 所 指向 的 对 
象 是 输出 不 了 的 。 但 如 果 是 可 变 长 结构 体 ， 其 内 存 区 域 自身 是 一 个 整体 ， 
此 可 以 简单 地 将 所 有 数据 输出 。 反 过 来 , 使 用 freadQ) 这 样 的 函数 ， 可 以 将 
数据 整体 再 读 取 ( 还原 ) 到 内 存 。 


但 无 论 怎样 ， 从 所 谓 的 ANSIC (ISO-IEC 9899-1990 ) 定义 的 语法 标准 来 
看 ， 可 变 长 结构 体 还 是 属于 违反 标准 的 技巧 。 因 为 规范 中 指出 ， 对 于 超出 范 
围 对 数组 的 访问 ， 并 不 保证 其 有 效 性 和 正确 性 。 

毕竟 大 部 分 的 环境 都 支持 “可 变 长 结构 体 ” 的 手法 ， 既 然 事 实 上 已 经 被 
广泛 使 用 ， 所 以 我 们 也 就 没有 必要 去 故意 回避 。 虽 然 提 出 了 “严守 规范 编程 ” 
( strictly confirming program ) 的 忠告 ， 但 在 实际 开发 中 也 不 能 过 于 教条 。 

顺便 告诉 大 家 ，ISO C99 (ISO/IEC 9899:1999 ) 中 ， 可 变 长 结构 体 已 经 被 
正式 承认 ， 并 且 成 为 专用 语法 。 


/ 


































































































4.3.2 ”从 1 开始 的 数组 


C 的 数组 下 标 是 从 0 开始 的 。 初 学 者 经 常 对 此 产生 困惑 ， 但 是 大 部 分 情 
况 下 ,“ 从 0 开始 ”要 比 “ 从 1 开始 ”让 人 感觉 更 加 合适 (参照 1.3 节 的 补充 
内 容 )。 


但 是 , 在 对 FORTRAN 开发 的 程序 进行 移植 的 时 候 , 情况 就 不 是 这 样 的 了 。 









































水 


水 


当然 , 正如 2.8 节 中 说 
明 的 那样 ,将 结构 体 整 
体 保存 在 文件 中 ,然后 
通过 网 络 进 行 传输 这 
样 的 操作 ,可 能 自身 会 
存在 一 些 问题 。 但 如 果 
是 通过 同一 台 机 器 上 
的 临时 文件 进行 数据 
交换 ,或 者 在 同一 台 机 
器 上 的 进程 间 进 行 通 
信 的 情况 下 ,即使 使 用 
了 这 种 方法 ,也 是 没有 
问题 的 。 





Windows 的 BMP 文件 
从 内 存 中 输出 的 。 对 于 
类 似 于 BMP 文件 这 样 
经 常 被 用 于 多 种 环境 
的 数据 文件 , 利用 “将 
整体 结构 体 从 内 存 中 
输出 ”的 这 种 方式 , 无 
论 如 何 都 只 是 Windows 
特有 的 做 法 :-P 
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这 种 情况 下 ， 可 以 通过 下 面 的 方法 勉强 地 做 出 从 1 开始 的 数组 : 


/* 需 要 一 个 1 一 10 的 数组 */ 

double hoge_buf[10]; 

double *hoge = &hoge_buf[-1]; 
此 时 ，hoge[1] 恰 好 就 指向 hoge_buf[0] 。 


如 果 是 多 维 数组 ， 就 像 下 面 这 样 : 


/* 需 要 4X4 的 二 维 数组 */ 
double a_buf[4] [4]; 








double (x*a)[4] = &a_buf[-1][-1]; 
其 实 很 时 之前， 上面 的 手法 就 为 大 家 所 知 ， 将 FORTRAN 程序 转换 成 C 


程序 的 工具 f2c 中 ,就 用 到 了 这 种 手法 。 但 是 , 严格 地 说 , 它 违 反 了 C 标准 。 


C 语言 中 , 对 指向 超出 数组 范围 以 外 的 指针 ,除非 它 指向 “最 后 元 素 的 下 
一 个 元 素 "， 其 他 情形 都 属于 未 定义 。 


因此 ， 对 于 下 面 的 语句 : 


double *a = &a_buf[-1]; 


















































因为 指针 变量 a 指向 了 a_buf[-1] ， 仪 任 这 一 点 就 违反 了 标准 ， 这 和 有 没有 
使 用 当前 这 个 指针 进行 实际 地 读 写 无 关 。 如 此 这 般 让 指针 指向 一 个 没有 被 分 
配 的 内 存 区 域 ， 在 不 同 的 处 理 环 境 中 ，CPU 可 能 会 抛 出 异常 ， 或 者 地 址 最 后 
被 “ 坚 头 转向 ”地 指 到 了 一 个 莫名 其 妙 的 地 方 。 

可 是 , C 标 准 却 偏偏 承认 指向 数组 “最 后 元 素 的 下 一 个 元 素 ” 的 指针 是 合 
法 的 ， 究 竞 为 什么 会 存在 这 个 不 公平 的 潜 规 则 ?关于 这 个 问题 ， 请 阅读 下 面 
的 补充 内 容 。 



































补 
馈 充 ”指针 可 以 指 到 数组 的 最 后 元 素 的 下 一 个 元 素 


C 标准 只 承认 指向 数组 的 “最 后 元 素 的 下 一 个 元 素 ” 的 指针 是 合法 的 。 
如 果 指 针 指 向 “最 后 元 素 的 下 下 个 元 素 ”( 这 和 有 没有 发 生 读 写 无 关 )， 此 
行为 就 被 认定 为 未 定义 。 

作为 理由 ，Rationale 里 记载 了 下 面 这 样 的 一 个 例子 : 


SOMETYPE array[SPAN]; 
AR 
for (p = &array[0]; p < &array[SPAN]; p++) 
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这 里 没有 使 用 循环 计数 器 ， 而 是 使 用 指针 遍历 数组 的 各 元 素 。 
如 此 这 般 ， 当 循环 到 达 终 点 时 ， 如 果 要 问 p 指向 哪里 ， 答 案 当 然 是 
&array[SPAN] 了 ， 也 就 是 array 的 最 后 元 素 的 下 一 个 元 素 。 
只 是 为 了 照顾 到 以 前 写 的 代码 ， 标 准 才 允许 指针 可 以 指 到 数组 的 “最 
EO Mo 
话说 回来 ， 本 书 还 是 推荐 “不 要 使 用 指针 运算 ， 而 是 使 用 下 标 来 访问 
数组 ”。 , Ry # 尽管 在 早期 使 用 指针 
如 果 只 是 为 了 照顾 到 很 久 以 前 的 事 ， 倒 是 大 可 不 必 勉 强 接受 这 个 奇怪 运算 可 以 写 出 执行 效 
的 潜 规则 。 率 高 的 代码 …… 


AA 


未 
草 
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5.1 案例 学 习 1: 计算 单词 的 出 现 频 


5.1.1 案例 的 需求 

直到 第 4 章 ， 本 书 主要 对 “声明 的 解读 方法 ”和 “数组 和 指针 的 微妙 3 
系 ”进行 了 说 明 。 

这 些 内 容 都 属于 C 语言 特有 的 话题 ， 正 因为 如 此 ， 人 们 才 普 遍 认为 “C 
的 指针 比较 难 ”。 


但 是 ， 指 针 同时 也 是 构造 链表 或 者 树 这 样 的 “数据 结构 ”必需 的 概念 。 
因此 ,在 比较 成 熟 的 、 正 统 的 编程 语言 中 ， 必 定 存在 指针 。 本 章 给 大 家 介绍 
在 构造 一 般 数 据 结构 的 过 程 中 指针 的 使 用 方法 。 


下 面 是 一 个 经 常 被 使 用 的 案例 ， 非 常 对 不 起 ， 这 的 确 是 一 个 没有 新 意 、 
老 掉 牙 的 案例 。 


设计 开发 一 个 将 文本 文件 作为 输入 ， 计 算出 其 中 各 单词 出 现 频 
率 的 程序 。 


这 个 程序 的 名 称 是 word_count 。 
使 用 下 面 的 命令 行 ， 
word_count 文件 名 


将 英文 文本 文件 的 文件 名 作为 参数 传递 给 word_count， 程 序 执行 的 结果 是 : 










































































米 


党 


对 于 链表 这 种 程度 的 
数据 结构 ,如 果 有 了 集 
合 类 库 , 操作 数据 时 就 
可 以 不 用 顾及 指针 的 
存在 了 。 


这 里 容易 和 UNIX 的 
wc 命令 产生 混淆 ， 可 
以 先 不 管 它 。 
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真正 的 指针 的 使 用 方法 








将 英文 单词 按照 字母 顺序 排序 后 输出 ， 并 且 在 各 单词 的 后 面 显示 当前 单词 的 
出 现 次 数 。 

















如 果 省 略 参数 ， 就 将 标准 输入 的 内 容 作 为 输入 进行 处 理 。 
补 ee 
村 yn 充 各 种 语言 中 对 指针 的 叫 法 
正如 我 反复 强调 的 那样 ， 如 果 没 有 指针 ， 就 无 法 构造 正统 的 数据 结构 ， 
* 以 前 ，FORTRAN 、 因此 ， 比 较 成 熟 的 、 正 统 的 编程 语言 ， 必 定 会 存在 指针 。 
COBOL 和 BASIC 中 
3 就 ) 00 
都 没有 指针 ， 但 是 在 呈 ? 我 怎么 听 说 Java 就 没有 指针 呢 
fortran90 、Visual Basic 我 可 以 负责 任 地 告诉 你 ， 这 是 个 谣言 。 
等 升级 版 中 ,正式 引入 第 4 章 的 补充 内 容 中 也 曾经 提 到 ，Java 只 能 通过 指针 来 操作 数组 和 对 
已 人 
了 指针 功能 。 象 ， 因 此 ，Java 比 C 更 离 不 开 指针 。 
* 请 参照 http://java.sun. 在 早期 的 Java 白皮书 中 ， 就 有 “Java 中 没有 指针 ”这 样 的 说 法 "。Java 


com/docs/overviews/ 中 被 称 为 “引用 ”的 概念 ， 在 C 和 Pascal 的 程序 员 看 来 ， 怎 么 看 都 相当 于 


java/java-overview-1. 


html。 


指针 。 我 认为 在 “Java 中 没有 指针 ”这 个 观点 的 背后 ， 弥 漫 着 下 面 这 样 “ 狠 
独 的 ”市 场 营 销 的 气味 ， 


因为 对 于 C 语 言 ， 大 家 都 认为 “指针 比较 难 ”"， 如 果 强 调 “ 没 

有 指针 ”， 编 程 新 手 也 许 更 容易 接受 。 

但 是 Java 的 引用 又 和 C 的 指针 有 着 很 大 的 不 同 。Java 没有 指针 运算 ， 
因此 不 存在 指针 运算 和 数组 之 间 的 那 种 微妙 关系 ， 此 外 你 也 不 能 取得 指向 
变量 的 指针 。 如 果 你 认为 这 些 差别 能 成 为 “Java 中 没有 指针 ”的 理由 ， 那 
么 Pascal 是 不 是 也 没有 指针 呢 ? 

除 Java 之 外 ，Lisp、Smalltalk 和 Perl ( Ver.5 以 后 ) 中 相当 于 指针 的 对 
象 也 被 称 为 “引用 ”， 但 是 也 有 人 会 使 用 “指针 ”这 样 的 叫 法 。 也 就 是 说 ， 
这 些 语言 并 没有 严格 地 将 “引用 ”和 “指针 ”分 开 。 因 为 它们 的 本 质 相同 ， 





# 诞生 在 日 本 的 面向 对 ”所 以 Java 故意 强调 “没有 指针 ”,， 反而 让 人 觉得 奇怪 。 
象 的 脚本 语言 Ruby， Ruby 中 连 字 符 串 这 样 的 基本 类 型 也 不 是 不 可 变 的 ， 像 这 样 的 语言 “ 没 
作者 在 自己 的 者 作 守 四 站 


乡 针 这 样 的 概念 ”， 其 
实 Ruby 中 也 有 叫做 
“引用 ” 


Ruby 中 没有 Pascal、Modula2/3 和 C 一 样 ， 都 称 之 为 指针 。 


Ada 中 的 名 称 为 “Access 类 型 "。 这 种 叫 法 有 点 人 让 人 摸 不 着 头脑 。 

的 指针 。 悲哀 的 是 ,C++ 在 语法 上 将 “指针 ”和 “引用 ”区 别 成 两 个 不 同 的 概念 。 
C++ 的 “指针 ”和 C、Pascal 的 “指针 ， 以 及 Java 的 “引用 ” 同 义 。 

其 次 ，C++ 中 的 “引用 ”是 指 本 来 应 该 被 称 为 “别名 ”( alias ) 的 对 象 ， 
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正 因 为 是 别名 ， 所 以 一 旦 确定 “别名 是 什么 ”， 就 再 也 不 能 修改 了 。 
实际 上 ,C++ 的 术语 “引用 ”也 是 通过 指针 实现 的 ， 所 以 它 其 实 是 一 个 
重复 的 功能 ,很 多 熟练 的 C++ 程序 员 人 往往 不 使 用 “引用 ”, 而 总 是 使 用 指针 。 
但 是 ， 在 茶 些 运算 符 重 载 ， 以 及 复制 构造 函数 的 场景 下 ， 可 能 会 不 得 不 使 
用 “引用 ”。 对 于 C++， 有 人 说 它 太 深奥 ， 有 人 说 使 用 它 开 发 项 目 成 本 太 高 ， 


甚至 有 人 质疑 “是 否 存在 理解 C++ 全 貌 的 人 ”…… 总 之 ，C++ 也 是 一 门 让 人 
纠结 的 开发 语言 。 


5.1.2 设计 

在 开发 大 型 应 用 程序 的 时 候 ， 非 常 有 必要 将 程序 按照 单元 功能 ( 模块 ) 
分 开 。 尽 管 这 次 的 程序 很 小 ， 但 为 了 达到 练习 的 目的 ， 我 们 准备 将 这 次 的 程 
序 模块 化 。 











将 word_count 程序 分 割 成 如 图 5-1 的 样子 。 






初始 化 


word_initialize 出 现 频率 
加 入 单词 数据 座 
a add_word 数据 及 
请 求 结果 输出 





单词 




















dump_word 输出 结果 














word_finalize 






图 5-1 word_count 的 模块 结构 
@ 取得 单词 部 分 
从 输入 流 (文件 等 ) 一 个 个 地 取得 单词 。 
@ 管理 单词 部 分 
管理 单词 。 最 终 的 结果 输出 功能 也 包含 在 这 部 分 。 
@ 主 处 理 过 程 
统一 管理 以 上 两 个 模块 。 
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# 好 像 本 书 的 章节 安排 都 对 于 “取得 单词 部 分 ”， 我 们 完全 可 以 直接 使 用 1.3.6 节 中 的 实现 。 














是 有 预谋 的 哦 ， 哈 哈 ! 





get_wordGO 中 ， 对 调用 方 输入 的 单词 字符 数 做 了 限制 ， 并 且 存 在 一 些 无 
# 此 时 ， 可 以 考虑 使 用 ” 论 如 何 都 不 允许 的 情况 "。 对 于 这 一 点 ， 其 实 不 必 过 于 纠结 ， 解 决 方案 是 提供 
4.24 节 中 介绍 的 方法 。 ”一 个 足够 大 的 缓冲 一 一 1024 个 字符 的 临时 缓冲 区 。 

















对 于 如 何 定义 “英语 单词 ”， 如 果 严 密 地 去 考虑 ， 那 就 没完 没 了 了 ,不 妨 
结合 现成 的 get_wordGO 中 的 实现 一 一 将 使 用 C 的 宏 (ctype.h ) isalnumQ) 返 
回 真 的 连续 的 字符 视 作 单词 。 


作为 公开 给 其 他 部 分 的 接口 ,“ 取 得 单词 部 分 ”提供 了 get_word.h (参照 
代码 清单 5-1 )， 在 需要 的 时 候 ， 可 以 通过 #inc1ude 引用 这 个 头 文件 。 








代码 清单 5-1 get word.h 





#ifndef GET_WORD_H_INCLUDED 
#define GET_WORD_H_INCLUDED 
#include <stdio.h> 


int get_word(char *buf，int size, FILE *stream) ; 





工 
2 
3 
4: 
Ds 
6 
7 





#endif /* GET_WORD_H_INCLUDED */ 




















这 次 的 主题 是 “管理 单词 部 分 ”。 
“管理 单词 部 分 ”提供 了 4 个 函数 作为 对 外 接口 。 
@ 初始 化 


void word_initialize(void); 





初始 化 “管理 单词 部 分 ”。 使 用 “管理 单词 部 分 ”的 一 方 ， 必 须 在 一 开始 
就 要 调用 word_initialize()。 


@ 单词 的 追加 
void add_word(char *word) ; 
向 “管理 单词 部 分 ”加 入 单词。 


add_word() 为 传 入 的 字符 串 动态 地 分 配 内 存 区域 ， 并 且 将 字符 串 保 存在 
其 中 。 


@ 输出 单词 的 出 现 频率 


void dump_wordCFILE *fp) ; 
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将 利用 add_word() 加 入 的 单词 按照 字母 顺序 进行 排序 , 并 且 向 各 单词 追 
加 它们 各 自 出 现 的 次 数 (调用 add_word() 的 次 数 )， 最 后 输出 fp 指向 的 流 。 


@ 结束 处 理 
void word_finalize(void); 


结束 “单词 管理 部 分 ”。 一 旦 结束 使 用 “单词 管理 部 分 ”， 需 要 调用 


word_finalize()。 


调用 word_finalize() 之 后 , 再 调用 word_initialize(), 管理 单词 部 
分 就 回 到 最 初 的 状态 (清空 了 过 去 加 入 的 单词 )。 


将 这 些 整理 到 头 文件 中 ， 如 代码 清单 5-2 所 示 。 





代码 清单 5-2 word_manage.h 











1: #ifndef WORD_MANAGE_H_INCLUDED 

2: #define WORD_MANAGE_H_INCLUDED 

3: #include <stdio.h> 

4: 

5: void word_initialize(void); 

6: void add_word(char *word) ; 

7: void dump_wordCFILE *fp); 

8: void word_finalize(void); 

9: 
10: #endif /* WORD_MANAGE_H_INCLUDED */ 








在 “ 主 处 理 过 程 ”中 , 使 用 get_word0Q 努 力 地 从 输入 流 读 取 单词 ,然后 
通过 调用 add_word0) ,将 每 次 读 取 到 的 单词 ,不 断 地 加 入 到 “单词 管理 部 分 ”， 
最 后 再 调用 dump_word() 将 最 终结 果 输 出 参照 代码 清单 5-3 )。 














代码 清单 5-3 main.c 





#include <stdio.h> 
#include <stdlib.h> 
#include "get_word.h" 
#include "word_manage.h" 


#define WORD_LEN_MAX (1024) 


int main(int argc, char **argv) 

{ 
char buf [WORD_LEN_MAX]; 
FILE *fp; 








POWUVooPoNOUUAWDNTPp 
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12: 
13 : if (argc == 1) { 
14: fp = stdin; 
15 : } else { 
16 : fp = fopen(argv[1], "r"); 
17 : if (fp == NULL) { 
18 : fprintf(stderr, "%s:%s can not open.\n", 
argv[0] ,argv[1]); 
19 : exit(1); 
20: } 
21:: } 
22: 
23: /* 初始 化 “管理 单词 部 分 ” */ 
24: word_initialize(); 
2 
26: /* 边 读 取 文 件 ， 边 加 入 单词 */ 
27 : while (get_ word(buf, WORD_LEN_MAX, fp) != EOF) { 
28: add_word(buf); 
29 : } 
30: /* 输出 单词 的 出 现 频率 */ 
31: dump_word(stdout); 
32: 
33: /* “管理 单词 部 分 ”的 结束 处 理 */ 
34 : word_finalize(); 
35 : 
36 : return 0; 
37: } 
中 , 特意 将 WORD_LEN_MAX 的 值 设 定 得 大 一 些 , 但 是 无 论 如 





代码 清单 5-3 




















何 ， 这 只 是 提供 给 临时 缓冲 的 空间 的 大 小 。 在 add_wordGO 内 部 ， 只 是 分 配 需 


要 的 内 存 区域 ， 并 且 将 字符 串 复制 进去 ， 所 以 不 会 浪费 太 多 的 内 存 区 


此 外 ,考虑 至 


钢 
TY 充 


写 头 文件 的 











法 


O 





| 例 程 的 简洁 ,本 章 的 程序 省 略 了 对 所 有 的 mall1ocG) 返 回 值 


头 文件 的 写法 


时 候 ， 必 须 遵守 下 面 两 个 原则 ， 


@ 所 有 的 头 文 件 中 ， 必 须要 有 防止 #include 重复 的 保护 。 
@ 所 有 的 头 文 件 只 #include 自己 直接 依赖 的 头 文件 。 


“防止 重复 #include 的 保护 ”是 指 , 假设 对 于 word manage.h ( 参照 代 
码 清单 5-2 ) 来 说 ， 
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#ifndef WORD_MANACE_H_INCLUDED 
#define WORD_MANACE_H_INCLUDED 


#endif /* WORD_MANAGE_H_INCLUDED */ 


如 果 像 上 面 这 么 做 ， 即 使 当前 头 文件 被 重复 #include， 其 中 的 内 容 也 会 被 
无 视 ， 因 此 ， 就 不 会 出 现 重复 定义 的 错误 。 

下 面 来 谈 谈 第 2 个 规则 。 假设 对 于 头 文件 ah， 它 依赖 于 头 文件 bh (使 
用 了 b.h 定 义 的 类 型 或 者 宏 等 )， 因 此 在 ah 的 开头 说 nclude 了 b.h。 比 如 ， 
WwWord manage.h 使 用 了 结构 体 FILE， 所 以 word manage.h 中 #include 了 
stdio.h。 

很 多 人 讨厌 将 #include 谈 套 来 写 ,但 在 ah 依赖 bh 的 时 候 ， 如 果 不 
采用 说 套 ， 就 需要 在 所 有 使 用 a.h 的 地 方 都 写成 下 面 这 样 ， 


#include "b.h" 


#include "a.h" 


这 样 做 是 不 是 有 点 策 揣 ? 不 光 每 次 写 得 很 辛苦 ， 而 且 将 来 某 个 时 刻 ah 
不 再 依赖 bn 后， 上面 的 两 行 可 能 就 永远 地 留 在 代码 中 了 。 另 外 ， 对 于 这 种 
#include 方式 ， 开 发 现场 的 “可 爱 的 ”程序 员 们 不 可 避免 地 会 有 下 面 的 
举动 ， 
唉 ~ 究竟 是 谁 依赖 谁 ， 真 是 完全 搞 不 明白 哦 ! 咖 ~， 先 把 已 
经 编译 通过 的 .c 文 件 中 开头 的 #include 部 分 完全 复制 过 来 吧 ， 














这 样 恶 摘 ， 肯 定 会 在 很 多 代码 文件 中 留 下 大 量 无 效 的 头 文 件 引 用 。 

啊 ? 你 问 Makefile 的 依赖 关系 是 怎么 做 的 ? 这 必然 是 通过 工具 自动 生 
成 的 一 一 这 可 是 常识 哦 。 

对 于 头 文件 ， 还 有 一 个 要 点 需要 跟 大 家 提前 说 明 ， 那 就 是 “应 该 把 公 
有 的 和 私有 的 分 开 ” 这 个 原则 ， 具 体 的 内 容 会 在 后 面 给 大 家 介绍 。 


要 点 

写 头 文件 时 必须 遵守 的 原则 : 

@ 所 有 的 头 文件 中 ， 必 须要 有 防止 重复 #include 的 保护 。 
@ 所 有 的 头 文件 只 #include 自己 直接 依赖 的 头 文件 。 


# 作为 C 的 编程 风格 的 
引导 书 ,著名 的 《 Indian 
Hill 编程 风格 手册 》 
(参照 http:/dennou-tms. 
U-tokyo.ac.jp/arch/com- 
ptech/cstyle/cstyle-ja.htm) 
中 , 也 表达 了 “不 要 用 
#include 葡 套 ”这 样 
的 观点 。 可 是 , 在 附属 
于 C 处 理 环境 的 头 文 
件 中 ,以 及 广泛 使 用 的 
开源 软件 中 ,随处 可 以 
看 到 菊 套 的 头 文件 。 
(第 8 次 印刷 注 : 上 面 
的 网 页 好 像 已 经 不 存 
在 了 ,但 在 http:/www. 
archive.org 中 输入 上 
面 的 URL， 应 该 可 以 
看 到 以 前 的 影子 ) 
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5.1.3 ”数组 版 


对 于 word_count 的 “管理 单词 部 分 ”的 数据 结构 ， 先 让 我 们 考虑 使 用 数 
组 来 实现 一 下 。 


在 使 用 数组 管理 单词 的 时 候 ， 可 以 考虑 采取 下 面 的 方式 : 


© 将 单词 和 其 出 现 的 次 数 整 理 到 结构 体 中 。 

@ 将 这 些 结构 体 组 织 成 数组 ， 并 且 管 理 各 单词 的 出 现 频 率 。 

@ 为 了 将 单词 的 追加 和 结果 输出 变 得 更 加 简单 ， 使 用 将 数组 的 元 素 按 照 
单词 的 字母 顺序 排序 的 方式 进行 管理 。 

据 此 写 的 头 文件 word manage _p.h 内 容 如 下 (参照 代码 清单 5-4 ): 


代码 清单 5-4 ”word manage p.h (数组 版 ) 
































1: #ifndef WORD_MANAGE_P_H_INCLUDED 
2: #define WORD_MANAGE_P_H_INCLUDED 
3: #include "word_manage.h" 

4: 

5: typedef struct { 

6 : char *hname; 

1 int count; 

8: } Word; 

9: 
10: #define WORD_NUM_MAX (10000) 
11: 
12: extern Word word_array[]; 
13: extern int num_of_word; 
14: 








15: #endif /* WORD_MANAGE_P_H_INCLUDED */ 

每 当 加 入 一 个 新 的 单词 时 ， 可 以 考虑 对 数组 进行 下 面 这 样 的 操作 : 

@ 从 数组 的 初始 元 素 开 始 遍历 。 如 果 发 现 同样 的 单词 , 将 此 单词 的 出 现 次 
数 加 1。 

@ 如 果 没 有 发 现 相同 的 单词 ， 就 在 行进 到 比 当前 单词 “大 的 单词 ”( 根据 
字母 顺序 ， 位 置 在 后 面 的 单词 ) 的 时 刻 ， 将 当前 单词 插入 到 “大 的 单词 ” 
前 面 。 

向 数组 中 插入 单词 的 方法 如 下 (参照 图 5-2 ): 
@ 将 插入 点 后 方 的 元 素 顺 次 向 后 移动 。 
@ 将 新 的 元 素 保存 在 空 出 来 的 位 置 上 。 
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@ 移 动 后 方 的 元 素 …… 


| @ 保 存在 空 的 区 域 上 


图 5-2 ”向 数组 插 和 人 元 素 



































此 时 出 现 的 问题 是 : 每 次 向 数组 插入 元 素 的 时 候 ， 必 须要 移动 后 方 的 
元 素 。 


一 般 地 ， 在 初始 化 数组 时 必须 要 确定 元 素 个 数 。 当 然 ， 你 可 以 使 用 4.1.3 
节 中 说 明 的 方法 ， 动 态 地 为 数组 分 配 内 存 空间 ， 此 后 使 用 realloc()“ 嘎 吓 
地 ”将 数组 伸 长 ……… 其 实 ， 前 面 曾经 给 大 家 建议 过 ， 应 该 避免 频繁 地 使 用 
realloc() 扩 展 内 存 区 域 (参照 2.6.5 节 )。 


如 果 采 用 下 节 中 介绍 的 “链表 ”， 就 可 以 规避 以 上 的 问题 * 其 实数 组 也 不 是 一 无 
是 处 。 排 序 后 数组 的 检 


数组 版 的 管理 单词 的 源 代码 为 代码 清单 5-5、 代 码 清单 5-6、 代 码 清单 5-7 索 速 度 非常 快 ,这 就 是 



































和 代码 清单 5-8 。 数组 的 一 个 优点 ,关于 
这 一 点 可 以 参照 5.1.5 
代码 清单 5-5 ”initialize.c( 数组 版 ) 
- - * 本 例 中 没有 对 数组 越 
#include "word_manage_p.h 界 情况 做 检查 。 
3: Word word_array [WORD_NUM_MAX]; 
4: int num_of_word; 
5: 
6: /六 六 六 六 米 六 六 米 米 六 米 米 六 米 米 六 六 米 六 六 米 六 六 六 米 六 六 六 六 六 米 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 玉米 六 六 六 六 六 六 六 六 六 
7: ”* 初始 化 管理 单词 部 分 
8: 米 米 米 六 六 六 六 六 米 六 六 六 闵 六 玉米 六 六 六 六 六 六 米 六 玉米 六 六 米 六 玉米 六 六 六 六 六 米 米 六 玉米 六 六 六 六 六 米 六 六 六 六 六 六 六 六 六 六 六 六 /6 
9: void word_initialize(void) 
10: { 
11: num_of_word = 0; 
12: 了 
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代码 清单 5-6 add word.c〈 数 组 版 ) 





MD co 上 上 上方 必 





#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include "word_manage_p.h" 


/* 
* 将 index 后 面 的 元 素 (包括 index) 依次 向 后 方 移动 
*/ 


static void shift_array(int index) 


{ 
int src; /* 被 复制 元 素 的 索引 */ 
for (src = num_of_word - 1; src >= index; src--) { 
word_array[src+1] = word_array[src]; 
} 
num_of_word++; 
} 
/* 


* 复制 字符 串 。 

# 尽管 大 多 数 处 理 环 境 都 有 strdup() 这 样 的 函数 ， 

# 但 是 ANSIC 规 范 中 却 没有 定义 这 个 函数 ， 姑 且 先 自己 写 一 个 。 
*/ 


static char *my_strdup(char *src) 


{ 
char *dest; 
dest = malloc(sizeof(char) * (strlen(src) + 1)); 
strcpy(dest, src); 
return dest; 
} 


/六 六 六 六 米 米 六 米 米 六 米 米 六 六 米 六 六 米 米 六 六 六 六 六 米 六 六 六 六 六 玉米 六 六 六 六 六 米 六 六 六 六 六 六 六 六 六 六 六 玉米 闵 六 六 六 六 六 
* 追加 单词 
沙洲 沙洲 水 玉米 炒米 米 米 洲 玉米 洲 玉 洲 水 米 洲 沙洲 炒米 炒米 炒米 炒米 玉米 炒米 玉米 炒米 炒米 炒米 米 玉米 炒米 炒米 米 洲 米 米 六 炒米 六 人 
void add_word(char x*word) 
t 
int 1; 
int result; 


for (i = 0; 1 < num of word; i++) { 
result = strcmp(word_array[i] .name, word); 
if (result >= 0) 
break ; 


} 
if (num_of_word != 0 && result == 0) { 
/* 发 现 相同 的 单词 */ 
word_array[i] .count++; 
} else { 
shift_array(i); 
word_array[i].name = my_strdup (word); 
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53: word_array[i].count = 1; 
54: } 
55: } 





代码 清单 5-7 dump word.c (数组 版 ) 





1: #include <stdio.h> 

2: #include "word_manage_p.h" 

3: 

4: void dump_word(FILE *fp) 

5: { 

6: int I 

7 

8: for (i = 0; i < num of word; i++) { 
9: fprintf(fp, "%-20s%5d\n", 
10: word_array[i].name, word_array[i].count); 
Ts } 
12: 了 











代码 清单 5-8 finalize.c ( 数组 版 ) 





1: #include <stdlib.h> 
2: #include "word_manage_p.h" 
3: 
4 /六 六 六 六 米 六 六 米 米 六 米 米 玉米 米 六 六 米 六 六 米 六 六 米 米 六 六 六 六 六 六 六 六 玉米 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 
51 * 管理 单词 部 分 的 结束 处 理 
6: 六 六 米 六 六 六 米 六 六 米 六 玉米 六 六 六 六 六 六 六 六 玉米 六 六 六 六 玉米 六 六 六 六 玉米 米 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 /6 
7: void word_finalize(void) 
8: { 
9: int 1; 
10: 
11: /* 释放 单词 部 分 的 内 存 区 域 */ 
12 : for (i = 0; i < num of word; i++) { 
13: free(word_array[i] .name); 
14: } 
15: 
16: num_of_word = 0; 
17: 了 











5.1.4 链表 版 
在 前 面 一 节 中 ， 我 们 指出 了 数组 版 中 存在 下 面 的 问题 ， 


口 中 途 向 数组 插入 元 素 ， 后 面 的 元 素 就 必须 依次 向 后 方 移动 ， 导 致 效率 
低下 。 

口 数组 初始 化 时 就 需要 决定 元 素 个 数 。 尽 管 可 以 使 用 real11ocG) 不 断 地 
进行 空间 扩展 ， 但 在 数组 占用 了 较 大 的 内 存 区 域 的 情况 下 ， 还 是 要 尽 
量 避 免 使 用 这 种 手法 。 




















* 当然 ， 在 删除 元 素 时 


如 果 需 要 填充 空 出 来 
的 位 置 , 也 有 必要 去 移 


动 后 面 的 元 素 。 此 时 


可 以 使 用 “删除 标记 ” 
这 种 手法 ,但 这 不 能 算 





是 正当 的 做 法 ,如 果 能 


不 用 还 是 不 要 用 吧 。 


» 
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使 用 被 称 为 链表 的 数据 结构 ， 可 以 避免 这 些 问 题 。 


链表 是 指 将 节点 ( node ) 对 象 通过 指针 连接 成 锁链 状 的 数据 结构 (参照 
5-3 )。 


节点 
ce 上 册 民 本 全 


使 用 NULL 来 
表示 终点 


图 5-3 ”链表 
为 了 通过 链表 来 管理 单词 , 在 结构 体 Word 中 追加 指向 下 一 个 元 素 的 指针 


next。 


typedef struct Word_tag { 


char *hame; 

int count; 

struct Word_tag *next; 
} Word; 














这 里 的 next 就 是 指向 下 一 个 元 素 的 指针 。 


代码 清单 5-9 就 是 链表 版 的 word_manage_p.h。 





代码 清单 5-9 word manage p.h (链表 版 ) 











1: #ifndef WORD_MANAGE_P_H_INCLUDED 
2: #define WORD_MANAGE_P_H_INCLUDED 
3 1: 

4: #include "word_manage.h" 

3 

6: typedef struct Word_tag { 

;A char *hame; 
8: int count; 
9: struct Word_tag *next; 
10: } Word; 
11: 
12: extern Word *word_header; 
13: 
14: #endif /* WORD_MANAGE_P_H_INCLUDED */ 











链表 通过 将 内 存单 元 链接 起 来 ,持续 地 给 Word 分 配 内 存 区 域 。 和 对 数组 
通过 realloc() 进 行内 存 扩展 不 同 ， 链 表 方 式 不 需要 连续 的 内 存 区 域 ， 所 以 
不 会 出 现 效 率 非常 低下 的 情况 。 


此 外 ， 链 表 元 素 的 插入 、 删 除 都 是 非常 方便 的 。 对 于 数组 ， 搬 人 元 素 时 
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需要 将 搬入 点 后 的 元 素 顺 次 向 后 移动 ， 对 于 链表 ， 只 需 简 单 地 调整 一 下 指针 
的 指向 就 完成 操作 了 。 链 表 中 的 元 素 不 需要 在 内 存 中 连续 排列 。 
以 下 是 对 链表 的 一 些 基 本 操作 ， 
0 检索 
通过 对 指针 进行 追踪 ， 从 链表 中 检索 出 目标 元 素 。 
/* header 是 链表 初始 元 素 的 地 址 */ 
for (pos = header; pos != NULL; pos = pos->next) { 


if (找到 目标 元 素 ) 
break ; 











} 
if (pos == NULL) { 

/st 没有 找到 目标 元 素 后 的 处 理 */ 
} else { 

/* 找到 目标 元 素 后 的 处 理 */ 


} 
@ 插入 
在 已 经 获得 指向 某 个 元 素 的 指针 pos 的 情况 下 ， 在 当前 元 素 的 后 面 插入 
新 的 元 素 new_item， 下 面 是 具体 操作 (参照 图 5-4 )， 








new_item->next = pos->next; 
pos->next = new_item; 


pos 


new_item 


图 5-4 向 链表 追加 元 素 


如 果 pos 指向 链表 的 最 后 一 个 元 素 ， 此 时 根据 实际 情况 ， 只 需要 在 链表 
的 末尾 追加 新 的 元 素 就 可 以 了 。 


这 一 次 我 们 使 用 的 是 “ 单 向 链表 ”， 因 为 从 单 向 链表 中 的 某 个 元 素 不 能 追 
溯 到 它 前 面 的 元 素 ,所 以 目前 还 不 能 将 一 个 新 的 元 素 插入 到 已 知 元 素 的 前 面 。 


@ 删除 
在 已 经 获取 指向 某 个 元 素 的 指针 pos 的 情况 下 ， 如 果 和 需要 删除 这 个 元 素 





























* pos 是 position 的 简称 。 


x* 实际 上 ,“ 将 元 素 先 追 
加 在 pos 的 后 面 ， 然 
后 交换 元 素 内 部 的 数 
据 内 容 ” 这 样 的 技巧 ， 
也 可 以 在 视觉 上 达到 
将 元 素 追 加 在 pos 前 
面 的 效果 。 在 C 语言 

开发 中 ,在 数据 元 素 自 

身 中 放 入 指针 信息 构 

造 一 个 链表 ,是 很 普遍 

的 做 法 ,如 果 只 是 移动 

“元 素 内 容 ”, 那么 在 确 

定 当前 元 素 内 容 被 哪 

个 指针 所 指向 时 ,就 比 

较 麻 烦 , 所 以 还 是 不 要 

用 这 种 方法 。 
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的 下 一 个 元 素 ， 可 以 进行 下 面 的 操作 (参照 图 5-5 )， 


temp = pos->next; 
pos->next = pos->next->next; 
free(temp); 





pos 


o| se @free() 此 元 素 


temp 





图 5-5 ”从 链表 删除 元 素 





对 于 单 向 链表 ， 即 使 是 获取 了 茶 个 元 素 的 指针 ， 也 无 法 删除 这 个 元 素 本 





* 这 里 也 可 以 用 将 pos 身 *"。 这 还 是 因为 不 能 追溯 到 它 前 面 的 元 素 的 缘故 。 
后 面 的 元 素 内 部 的 数 
据 内 容 复制 到 pos, 然 链表 版 的 管理 单词 部 分 的 源 代码 为 代码 清单 5-10、 代 码 清单 $S-11、 代 码 





后 删除 掉 pos 后 面 的 ”清单 5-12 和 代码 清单 5-13。 
元 素 ” 这 样 的 技巧 。 但 


各 末 要 删除 最 后 一 个 ”有 宰 清单 10 tal2eet 途 娄 所 
元 素 , 这 种 方法 就 无 能 











为 力 了 。 1: #include "word_manage_p.h" 

2 

3: Word *word_header = NULL:; 

4: 

5 /六 六 六 六 米 米 六 米 米 六 米 米 六 六 米 六 六 米 米 六 六 六 六 玉米 六 六 六 六 六 玉米 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 
6: ”* 初始 化 单词 管理 部 分 

yy 沙洲 玉米 水 玉米 炒米 米 米 米 米 米 洲 玉 洲 玉米 洲 沙洲 炒米 炒米 炒米 炒米 玉米 炒米 玉米 炒米 炒米 炒米 米 玉米 炒米 玉米 米 洲 炒米 六 炒米 六 人 
8: void word_initialize(void) 

9: { 
10: word_header = NULL; 
1 








代码 清单 5-11 add word.c (链表 版 ) 





#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include "word_manage_p.h" 


/* 

x* 复制 字符 囊 

** 尽管 大 多 数 处 理 环境 都 有 Strdup() 这 样 的 函数 ， 

* 但 是 ANSIC 规范 中 却 没有 定义 这 个 函数 ， 姑 且 先 自己 写 一 个 。 
*/ 





OWWoNOUUPAWUDNTDP 


Ep 
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static char xmy_strdup(Cchar *src) 


{ 
char *dest; 
dest = malloc(sizeof(char) * (strlen(src) + 1)); 
strcpy(dest, src); 
return dest; 
} 
/* 
* 生成 新 的 Word 结构 体 
*/ 
static Word *create_word(Cchar xname) 
{ 
Word *hnew_word; 
new_word = malloc(sizeof (Word)); 
new_word->name = my_strdup(name); 
new_word->count = 1; 
new_word->next = NULL; 
return new_word ; 
} 


/六 六 六 六 米 米 六 米 米 六 米 米 六 米 米 六 六 米 六 六 米 六 六 六 六 六 玉米 玉米 米 六 六 玉米 六 玉米 六 六 六 六 六 六 六 六 玉米 六 玉米 六 六 六 六 六 六 
* 追加 单词 
玉米 炒米 炒米 洲 玉米 洲 玉米 洲 炒米 炒米 米 玉米 米 炒米 炒米 洲 玉米 洲 米 米 洲 玉米 炒米 炒米 米 玉米 六 玉米 洲 玉米 六 玉米 炒米 炒米 炒米 米 / 
void add_word(char *word) 


{ 
Word *pos; 
Word *prev;  /* 指向 pos 前 一 个 Word 元 素 的 指针 */ 
Word *hew_word; 
int result; 
prev = NULL; 


for (pos = word_header; pos != NULL; pos = pos->next) { 
result = strcmp(pos->name, word); 
if (result >= 0) 
break; 


prev = pos; 
} 
if (word_header != NULL && result == 0) { 
/* 发 现 相同 的 单词 */ 
pos->count++; 
} else { 
new_word = create_word(word); 
if (prev == NULL) { 
/* 插入 到 初始 位 置 */ 
new_word->next = word_header; 
word_header = new_word; 
} else { 
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65 : new_word->next = pos; 
66 : prev->next = new_word; 
67 : } 
68: } 
69: } 








代码 清单 5-12 ”dump word.c (链表 版 ) 





MD Co、 上 上 UP 上 必 





#include <stdio.h> 
#include "word_manage_p.h" 


/六 六 六 六 米 米 六 米 米 六 米 米 六 六 米 六 六 米 米 六 六 六 六 六 六 六 六 六 六 六 玉米 六 玉米 六 六 六 六 六 六 六 六 玉米 六 六 六 六 六 六 六 六 六 六 六 六 
* 将 内 存 中 的 单词 输出 
沙洲 玉米 水 玉 米 水 米 米 米 炒米 沙洲 玉 洲 米 玉 水 米 玉米 米 米 米 米 炒米 炒米 炒米 米 洲 米 炒米 玉米 炒米 炒米 炒米 炒米 炒米 六 炒米 六 炒米 六 人 
void dump_word(FILE *fp) 


{ 
Word #pos ; 
for (pos = word_header; pos; pos = pos->next) { 
fprintf(fp, "%-20s%5d\n", 
pos->name, pos->count); 
} 
} 








代码 清单 5-13 finalize.c 





(‘OooOoONOUMUPAWUDPpP 





#include <stdlib.h> 
#include "word_manage_p.h" 


/六 六 六 六 米 米 六 米 米 六 米 米 六 六 米 六 六 米 米 六 六 六 玉米 米 六 六 六 六 六 六 米 六 玉米 六 六 六 六 六 六 六 六 六 六 六 玉米 六 六 六 六 六 六 六 六 六 
* 管理 单词 部 分 的 结束 处 理 
沙洲 玉 洲 玉米 米 水 米 米 米 米 玉米 洲 玉 洲 玉米 洲 米 玉米 米 米 炒米 炒米 炒米 炒米 米 玉米 炒米 炒米 炒米 炒米 炒米 炒米 炒米 洲 米 米 六 炒米 六 人 
void word_finalize(void) 


Word *temp; 

/* 将 所 有 登录 的 单词 free() */ 

while (word_header != NULL) { 
temp = word_header; 
word_header = word_header->next; 
free(temp->name); 
free(temp); 

} 

} 











这 里 的 add_wordQ) 和 数组 版 一 样 ， 从头 开始 顺序 地 遍历 链表 。 行进 至 





当前 单词 








大 的 单词 ”( 按照 字母 顺序 处 在 后 面 的 单词 ) 时 ， 将 当前 单词 扣 








比 
入 





到 这 个 “大 的 单词 ”前 面 。 但 是 对 于 单 向 链表 ， 在 发 现 了 比 当 前 单词 “大 的 
单词 ”的 时 候 ， 无 法 在 其 前 面 搬入 当前 单词 。 因 此 ， 在 例 程 中 ， 声 明了 一 个 














5.1 案例 学 习 1: 计算 单词 的 出 现 频率 


209 





称 为 prev 的 指针 ， 它 指向 pos 前 面 一 个 元 素 。 


word_finalize() 通 过 free(0) 释 放 链 表 中 所 有 的 元 素 。 用 一 句 话 来 表述 




















就 是 : 从 链表 的 初始 元 素 开 始 将 元 素 一 个 个 剥离 ， 然 后 free() 掉 。 
此 时 ， 很 多 人 也 许 会 写 出 下 面 的 代码 ， 





Word *pos ; 





/* 从 链表 的 初始 位 置 开 始 顺序 地 遍历 ， 然 后 进行 free() (意图 上 ) */ 


for (pos = word_header; pos != NULL; pos = pos->next) { 
free(pos->name) 
free(pos); 

} 


以 上 这 段 代 码 是 错误 的 。 将 pos 通过 free() 释 放 掉 之 后 ， 应 该 是 不 能 引用 
pos->next 了 吧 。 但 是 这 段 程 序 在 一 般 处 理 环 境 中 还 是 能 很 好 地 执行 。 但 在 某 些 




















环境 中 也 会 给 我 们 带 来 麻烦 ( 参照 2.6.4 节 )。 





补 
名 充 头 文件 的 公有 和 私有 


本 章 在 统计 单词 出 现 频率 的 应 用 中 , 对 于 “管理 单词 部 分 ”, 介绍 了 “ 数 
组 版 ”和 “链表 版 ”两 个 版 本 的 程序 。 

可 是 ,“ 管 理 单词 部 分 ”向 外 部 公开 的 头 文件 word manage.h 却 没有 发 
生 任何 改动 。 因 此 ， 即 使 将 “管理 单词 部 分 ”的 实现 方式 从 数组 变 成 链表 ， 
对 于 使 用 它 的 一 方 (main.c ) 也 没有 必要 做 任何 的 修改 ,也 不 需要 再 重新 编 
译 ( 只 需 重新 连接 一 次 就 可 以 了 )。 

“管理 单词 部 分 ”向 外 部 公开 的 的 头 文 件 word manageh 和 用 于 “管理 单词 
部 分 ”内 部 共享 数据 的 头 文件 word manage p.h， 是 完全 分 离 的 。 因 此 , 无 
论 “ 管 理 单 词 部 分 ”内 部 的 实现 怎样 变化 ， 都 不 会 给 “使 用 的 一 方 ” 带 来 影响 。 

我 一 般 将 向 外 部 公开 的 头 文件 称 为 “公共 头 文件 ”， 将 用 于 内 部 共享 数 
据 的 头 文 件 称 为 “私有 头 文件 ”。 

私有 头 文件 的 内 部 大 多 都 使 用 了 公共 头 文 件 提 供 的 类 型 、 宏 或 者 函数 ， 
所 以 私有 头 文件 在 大 部 分 的 情况 下 ， 都 #include 了 公共 头 文件 。 

但 是 , 无 论 是 间接 地 还 是 直接 地 ,公共 头 文 件 都 不 可 能 #include 私有 
头 文件 。 这 就 好 比 对 于 一 个 公司 来 说 ， 将 向 公司 外 部 发 布 的 宣传 资料 同时 
在 公司 内 部 公开 ， 是 没有 问题 的 ， 但 是 公司 内 部 的 商业 资料 ( 内 部 机 密 ) 
要 是 流传 到 公司 外 部 ， 那 就 ……11 
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* 对 于 Java、Ada 或 者 
C++ 这 样 的 自身 有 命 
名 空间 控制 的 语言 , 纺 
程 时 是 不 需要 依赖 命 
令 规 约 的 。 但 是 在 现实 
中 , java.awt.List 和 
java.util.List 还 
是 经 常会 发 生 冲 突 ,让 
人 感到 困惑 。 现 在 , 在 
Swing 中 ， 也 在 类 名 加 
上 了 “J” 这 样 的 前 缀 ， 
这 就 说 明 命 名 规约 还 
是 必要 的 。 





如 果 遵 守 以 上 的 规则 , 私有 头 文件 中 记述 的 内 容 就 不 会 暴露 给 使 用 它 的 
模块 ， 因 此 ， 在 大 型 程序 的 开发 中 ， 可 以 使 用 多 团队 来 各 自分 担 开发 任务 。 

此 外 ， 在 开发 大 型 程序 的 工程 ， 对 于 函数 名 、 全 局 变量 名 ， 公 共 头 文 
件 中 声明 的 类 型 名 、 宏 名 ， 会 使 用 “命名 规约 ”来 防止 名 称 冲突 *。 但 是 这 
次 的 例 程 中 ， 我 们 还 没有 做 到 这 么 规范 。 


补 
Ty 充 怎样 才能 同时 使 用 多 份 数据 


在 如 今 的 应 用 程序 中 (MS-Word、MS-Excel 等 )， 同 时 打开 多 个 文件 ， 
并 且 分 别 在 不 同 的 窗口 进行 编辑 ， 已 经 是 很 正常 的 事情 了 。 

可 是 ， 在 这 次 的 “管理 单词 部 分 ”， 无论 是 数组 版 还 是 链表 版 ,数据 的 
“源头 ”都 保存 在 全 局 变量 中 。 因 为 全 局 变量 “在 同一 时 刻 只 存在 一 份 ”， 
所 以 无 法 同时 使 用 多 份 数据 。 

如 果 要 解决 这 个 问题 ， 不 妨 将 保存 数据 的 “源头 ”的 部 分 定义 成 结构 
体 ， 对 于 链表 版 ， 可 以 定义 成 下 面 这 样 ， 

typedef struct { 


Word *word_header; 
} WordManager; 


然后 , 在 word_initialize() 中 , 使 用 malloc() 给 WordManager 分 
配 新 的 内 存 区 域 ， 并 且 返 回 指向 这 片 内 存 区 域 的 指针 。 


WordManager *word_initialize(void); 


另外 ， 对 于 “管理 单词 部 分 ”的 其 他 函数 ， 都 将 指向 WordManager 的 
指针 作为 第 1 个 参数 进行 传递 。 
void add_word(WordManager* word_manager, char *word); 


void dump_word(WordManager* word_manager, FILE *fp); 
void word_finalize(WordManager* word_manager); 


通过 这 样 的 方式 ,使 用 “管理 单词 部 分 ”的 一 方 能 够 管理 多 个 
WordManager， 当 然 也 就 可 以 同时 使 用 多 份 数 据 。 

此 外 ， 对 于 在 公共 头 文件 中 声明 的 WordManager 类 型 中 ，Word 类 型 也 
是 必须 的 ， 因 此 ， 此 时 对 使 用 方 屏蔽 了 “使 用 了 链表 ”这 个 实现 上 的 细节 。 

其 实 对 于 使 用 方 来 说 ， 只 有 指向 WordManager 的 指针 才 是 必须 的 ， 并 
没有 必要 知道 内 部 的 细节 。 这 种 情况 下 ， 只 声明 一 个 “不 完全 类 型 ”倒是 
A 
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typedef struct WordManager_tag WordManager; 


然后 在 私有 头 文件 中 ， 将 实体 填充 到 struct WordManager_tag 中 ， 


struct WordManager_tag { 
Word *word_header; 


D9 


5.1.5 ”追加 检索 功能 


目前 的 word_count 仅仅 是 读 取 文本 文件 , 然后 输出 统计 数据 。 既然 好 不 
容易 统计 出 文本 文件 中 各 单词 的 出 现 频 率 ， 如 果 程 序 还 能 提供 “这 个 单词 出 
现 了 儿 次 ”这 样 的 功能 是 不 是 更 好 ? 

因此 ,在 “管理 单词 部 分 ”中 追加 下 面 的 接口 ， 

int get_word_count(char *word); 

返回 通过 WOrd 指定 的 单词 的 出 现 次 数 。 

最 简单 的 方法 就 是 ， 对 保存 在 数组 或 者 链表 中 的 单词 ， 从 头 开始 顺序 地 
遍历 ， 这 样 肯 定 能 检索 到 目标 单词 。 这 种 方法 称 为 线性 检索 ( linear search )。 
但 是 对 于 数组 中 的 数据 已 被 排序 的 情况 ， 可 是 考虑 使 用 效率 更 高 的 二 分 检索 
( binary search )。 


以 下 是 二 分 检索 的 过 程 ， 
@ 定位 到 数组 中 央 的 元 素 。 
@ 如 果 此 元 素 是 


QO 要 检索 的 目标 元 素 ， 结 束 检索 。 
@ 比 要 检索 的 目标 元 素 小 ， 就 对 数组 中 此 元 素 后 面 的 元 素 进行 相同 

































































操作 。 
@ 比 要 检索 的 目标 元 素 大 ， 就 对 数组 中 此 元 素 前 面 的 元 素 进行 相同 
操作 。 





其 实 我 们 在 查 字典 的 时 候 ， 也 经 常 使 用 这 个 方法 。 
代码 清单 5-14 是 “数组 版 ”的 get_word_count() 的 实现 例 程 。 
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真正 的 指针 的 使 用 方法 





代码 清单 5-14 get_ word count.c 








/六 六 六 六 米 米 六 米 米 六 米 米 六 六 米 六 六 米 六 六 米 米 六 六 六 六 六 六 六 六 六 六 六 玉米 六 六 六 六 六 六 六 六 玉米 六 六 六 六 六 六 六 六 六 六 六 六 


六 米 六 六 米 米 六 米 米 玉米 六 六 六 米 六 六 米 米 六 六 六 六 六 六 六 六 六 六 六 六 六 六 玉米 六 玉米 六 六 六 六 六 玉米 六 玉米 六 玉米 六 六 六 六 六 阔 了/ 


result = strcmp(word_array[mid] .name, word); 


1: #include <stdio.h> 

2: #include <string.h> 

3: #include "word_manage_p.h" 

4: 

5: ”* 返回 某 单词 出 现 的 次 数 

6: 

7: int get word_count(char *word) 
8: { 

9: int left = 0; 
10: int right = num_of_ word - 1; 
11: int mid; 
12: int result; 
13 : 
14: while (left <= right) { 
5:: mid = (left + right) / 2; 
16 : 
17 : if (result < 0) { 
18 : left = mid + 1; 
19 : } else if (result > 0) { 
20 : right = mid - 1; 
21: } else { 
22: return word_array[mid] .count; 
必 记 } 
24: } 
25 : return 0; 
26: } 








这 种 方法 只 对 数组 有 效 。 对 于 链表 ， 因 为 很 难 ( 迅速 地 ) 找到 “中 央 的 


元 素 "， 所 以 不 能 使 用 二 分 检索 。 





任何 一 种 数据 结构 都 不 是 万 能 的 ， 各 自 都 有 自己 的 优 缺 点 ， 我 们 必须 根 
据 实际 需要 选择 合适 的 数据 结构 。 比 如 在 元 素 的 个 体 相 对 比较 大 的 情况 下 ， 


就 推荐 使 用 指针 的 可 变 长 数组 ( 参照 





图 5-6 )。 


使 用 reallocO) 
扩展 指针 的 数组 

















图 5-6 使 用 指向 元 素 的 指针 的 数组 
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如 果 是 这 种 方式 ， 即 使 每 一 个 元 素 都 比较 大 ， 指 针 的 数组 自身 占用 的 内 
存 区 域 也 不 会 变 得 很 大 ， 因 此 也 许可 以 使 用 realloc() 来 不 断 地 增加 数组 的 








内 存 空间 。 这 种 情况 下 ， 可 以 使 用 二 分 法 做 检索 操作 。 

题 
外 
—# 话 





倍 倍 游戏 


在 数据 量 少 的 情况 下 ， 无 论 是 使 用 线性 检索 还 是 二 分 检索 ， 执 行 效率 
上 并 不 会 产生 显著 的 差距 。 可 是 ， 随 着 数据 量 的 增加 ， 二 分 检索 在 执行 效 
率 上 就 会 凸显 出 压倒 性 的 优势 。 

对 于 上 面 的 结论 ， 也 许 有 人 会 产生 疑问 : 


真 的 吗 ? 三 分 检索 的 逻辑 复杂 性 肯定 也 会 影响 执行 效率 
吧 ? 是 不 是 会 和 自身 原本 的 优势 相互 抵消 吃 ? 结果 就 是 ， 二 分 
检索 和 线性 检索 的 效率 不 会 相差 很 大 呢 ! 


对 于 线性 检索 ， 随 着 数据 量 的 增加 ， 检 索 时 间 按 比例 延长 。 但 是 ， 使 
用 二 分 检索 的 时 候 ， 数 据 每 增加 一 倍 ， 检 索 次 数 只 会 增加 一 次 。 因 此 ， 即 
使 是 数据 量 大 到 现实 中 无 法 想象 的 地 步 ， 也 能 够 使 用 很 短 的 时 间 将 数据 检 
索 出 来 。 

为 了 更 感性 地 理解 这 一 点 ， 下 面 给 大 家 打 一 个 比方 。 

假设 手头 有 一 张 报纸 ， 它 的 厚度 是 0.1mm， 将 它 对 折 ， 厚 度 就 变 成 了 
0.2mm， 再 对 折 ， 就 变 成 了 0.4mm 了 吧 。 

那么 ， 这 样 折 了 100 次 后 ， 厚 度 变 成 了 多 少 呢 ? 

当然 ， 也 许 我 们 折 不 了 这 么 多 次 ， 此 时 切 成 两 份 再 堆积 起 来 ， 也 能 达 
到 同样 的 目的 。 还 是 让 我 们 单纯 从 数字 上 来 回答 : 对 折 100 次 后 的 厚度 是 
区 

1 米 左 右 ? NO ~NO~ 答 案 是 , 约 134 亿 光 年 。 如 果 你 不 信 ， 你 可 以 用 
手头 的 计算 器 算 算 (1 光 年 为 9 兆 4600 亿 KM)。” 

也 就 是 说 ， 如 果 使 用 二 分 检索 ， 对 于 “134 亿 光 年 /0.1mm” 条 数据 ， 仅 
仅 100 次 循环 就 完成 检索 了 。 这 么 大 的 数据 量 , 如 果 选 择 使 用 线性 检索 …… 
嗯 ， 秋 怕 在 我 有 生 之 年 是 完成 不 了 这 个 工作 了 。 

















中 来 自 曾 吕 利 新 左 卫 门 和 丰 臣 秀吉 之 间 的 一 段 对 话 ， 曾 吕 利 新 左 卫 门 对 丰 臣 秀吉 说 :“ 作 为 























奖赏, 第 1 天 给 1 粒 米 , 次 日 给 第 1 天 的 加 倍 的 量 , 再 次 日 给 第 2 天 加 们 的 量 , 如 此 这 般 。 
一 一 译 者 注 
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# 确实 ,在 元 素 个 数 很 多 


的 情况 下 ， 使 用 
realloc() 来 扩展 数组 
的 内 存 区 域 ,有 点 …… 


# 所 以 对 于 我 来 说 ,在 机 


器 猫 的 道具 中 ， 比 起 
“地 球 毁 灭 炸弹 ”( 参照 
际 虫 系列 漫画 第 7 卷 )， 
“加 们 药水 ”( 参照 天 道 
虫 连 环 漫 画 第 17 卷 ) 
更 让 我 感到 “ 坑 驳 ”， 
哈哈 。 


真正 的 指针 的 使 用 方法 
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5.1.6 ”其 他 的 数据 结构 
这 一 节 介 绍 一 下 其 他 的 数据 结构 。 
会 双向 链表 
之 前 为 大 家 介绍 过 “ 单 向 链表 ”。 
因为 “ 单 向 链表 ”不 能 “回溯 ”， 所 以 它 有 以 下 缺点 ， 


@ 在 向 链表 中 追加 元 素 的 时 候 ， 必 须要 知道 追加 点 前 面 的 元 素 。 
@ 从 链表 中 删除 元 素 的 时 候 ， 必 须要 知道 被 删除 元 素 前 面 的 元 素 。 
@ 很 难道 向 遍历 链表 。 


如 果 是 双向 链表 ( double linked list )， 就 可 以 解决 上 面 的 问题 。 


we ST SS 


图 5-7 双向 链表 





























使 用 结构 体 定义 链表 ， 大 概 就 像 下 面 这 样 : 
typedef struct Node tag { 
/* Node 自身 的 数据 */ 


struct Node_tag *prev; /* 指向 前 一 个 元 素 的 指针 */ 
struct Node_tag x*hnext; /* 指向 后 一 个 元 素 的 指针 */ 
} Node; 


可 是 ， 双 向 链表 也 有 不 足 的 地 方 ， 

@ 因为 每 个 元 素 都 需要 2 个 指针 ， 所 以 会 消耗 多 余 的 内 存 。 

@ 指针 操作 过 于 频繁 ， 编 程 容易 出 现 bug。 

全 村 

UNIX 和 DOS 的 “目录 ”， 以 及 Windows 和 Macintosh 的 “文件 夹 ”都 是 层 
次 结构 。 这 样 的 数据 结构 好 似 一 棵 倒置 的 树 , 所 以 我 们 称 之 为 “ 树 ”(tree ) 结构 。 


树 中 的 各 元 素 称 为 节点 (node )。 最 根部 的 节点 称 为 根 ( root )。 某 节点 A 
在 节点 B 的 直接 下 方 的 位 置 ，A 就 称 为 B 的 子 (child ) 市 点 ，B 就 称 为 A 的 
父 (parent ) 节点 。 比 如 ， 在 图 5-8 中 ，Node5 为 Node2 的 子 闻 点 ，Node2 为 
Node5 的 父 节点 。 父 节点 和 子 节 点 之 间 的 连接 线 称 为 枝 ( branch )。 
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根 (root) 






枝 (branch) 


Node13 





Node11 Node12 


图 5-8 树 


使 用 C 语言 表示 树 的 时 候 ， 一 般 定 义 一 个 像 下 面 这 样 的 结构 体 (参照 
图 5-9 )， 





typedef struct Node_tag { 


/* 节点 自身 的 数据 */ 


int nchildren;  /* 子 的 个 数 */ 
struct Node_tag **child; /* 此 指针 指向 的 是 通过 mal1oc() 分 配 的 内 
存 区 域 ， 其 中 包含 指向 子 节点 的 指针 的 可 
变 长 数组 #/ 
} Node; 
Node 

















通过 mal1locQ 分 配 的 内 存 区 域 ， 共 中 
包含 指向 子 节点 的 指针 的 可 变 长 数组 


图 5-9 ”如 果 使 用 C 来 表示 树 …… 
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如 果树 中 的 任意 节点 最 多 只 有 两 个 子 节 点 ， 此 时 称 这 种 树 为 二 又 树 
* 问题 :最 多 只 有 一 个 子 (binarytree ) ~。 
节点 的 树 , 怎么 称呼 ? 
一 一 是 “链表 ” 哦 。 使 用 二 又 树 的 二 又 检 索 树 ( binary search tree ) 这 样 的 数据 结构 ， 
也 适用 于 前 面 的 word_count 这 个 案例 。 


二 义 检 索 树 是 所 有 节点 满足 以 下 条 件 的 二 又 树 ( 参照 图 5-10 )， 


@ 市 点 p 左 侧 的 子 都 小 于 p 
@ 节点 p 右 侧 的 子 都 大 于 pp 


如 果 这 旦 




















[大 
氏 





本 侧 的 所 有 市 点 都 小 于 p 本 侧 的 所 有 市 点 都 大 于 p 


图 5-10 二 又 检索 树 
对 二 又 树 元 素 的 追加 和 检索 ， 按 以 下 方式 进行 。 
@ 追加 


从 根 开始 顺序 地 追加 ， 如 果 追 加 的 元 素 小 于 当前 节点 ， 就 向 左 移动 ， 大 
于 当前 节点 ， 就 向 右 移动 。 如 果 遇 到 相等 的 节点 或 者 NULL， 就 将 元 素 追 加 到 
当前 位 置 。 

@ 检索 

从 根 开始 顺序 地 遍历 ， 如 果 追 加 的 元 素 小 于 当前 节点 ， 就 向 左 移动 ， 大 
于 当前 节点 ， 就 向 右 移动 。 一 旦 查找 到 目标 节点 ， 检 索 结 束 。 如 果 遇 到 NULL 
的 元 素 ， 就 说 明 树 中 不 存在 目标 元 素 。 

如 果 二 又 树 的 结构 比较 理想 ， 追 加 和 检索 应 该 还 是 非常 快速 的 。 可 是 ， 


最 坏 的 情况 下 (比如 ， 对 word_count 按照 字母 排序 进行 处 理 )， 二 叉 树 只 不 
过 是 个 链表 而 已 。 












































5.1 案例 学 习 1: 计算 单词 的 出 现 频率 217 





在 不 同情 况 下 ， 单 纯 的 二 叉 树 在 效率 上 的 表现 是 参差 不 齐 的 ， 而 且 还 容 
易 引 起 worst-case ， 所 以 现实 中 , 单纯 的 二 叉 树 可 能 并 不 实用 。 有 时 候 可 以 用 
B 树 、AVL 树 等 来 代替 单纯 的 二 叉 树 。 

全 哈 希 
常生 活 中 ， 我 们 怎样 管理 大 量 的 数据 (假设 它们 记录 在 卡片 上 ) 呢 ? 
而 且 对 这 些 数据 的 追加 、 删 除 和 检索 等 操作 还 十 分 频繁 。 

干事 严谨 的 人 ， 会 将 记录 数据 的 卡片 排 好 顺序 进行 保存 。 此 时 ， 使 用 二 
分 法 检索 应 该 是 个 不 错 的 选择 。 可 是 ， 在 需要 保证 数据 有 序 的 情况 下 ， 插 入 
卡片 是 相当 花费 时 间 的 ( 尤其 当 卡 片 保存 在 多 个 抽 居 中 时 )。 

懒散 的 人 会 把 所 有 的 卡片 一 齐 扔 到 一 个 箱子 中 ， 想 找 一 张 卡 片 的 时 候 ， 
他 也 许 会 从 头 开始 一 张 张 地 去 寻找 。 这 种 方式 对 于 追加 操作 很 简单 ， 但 是 检 
索 过 程 却 格外 地 花费 时 间 。 

如 果 是 严谨 而 又 不 失灵 活 的 人 ， 会 考虑 将 卡片 放 进 几 个 分 好 类 的 箱子 中 
进行 管理 。 

所 谓 哈 希 (hash ) 就 是 基于 上 面 第 三 种 想法 进行 构造 的 。 

典型 的 哈 希 结构 “ 链 式 哈 希 ”就 是 通过 在 哈 希 表 ( hash table ) 中 保存 链 
表 的 方式 ， 实 现 对 元 素 的 管理 (参照 图 5-11 )。 

哈 希 表 


CC HC 































































































图 5-11 链 式 哈 希 











* 输入 的 数据 从 一 开始 
就 有 序 的 情况 也 很 多 
见 。 





* 除 此 之 外 ， 还 有 完全 
哈 希 、 线 性 再 哈 希 、 非 
线性 再 哈 希 等 种 类 的 
哈 希 结构 。 但 是 我 很 少 
见 到 它们 用 于 现实 中 。 
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此 时 ， 通 过 哈 希 函数 来 决定 保存 某 元 素 的 哈 希 表 的 下 标 。 哈 希 函 数 根据 
检索 的 key ( 对 于 word_count 的 get_word_count() ，key 就 是 单词 的 字符 
串 ), 会 尽量 返回 一 个 无 规律 的 值 。 在 将 字符 串 作 为 key 的 情况 下 ， 哈 希 兄 数 
通常 会 使 用 “将 每 个 字符 进行 移 位 运算 ， 然 后 进行 加 法 运算 ， 其 结果 除 以 哈 
希 表 的 元 素 个 数 ， 最 后 得 到 余数 ”这 样 的 算法 。 如 果 不 走运 ， 哈 希 函 数 对 于 
不 同 的 key 也 会 返回 相同 的 值 ， 此 时 这 些 key 被 称 为 同义词 (synonym )。 


在 检索 的 时 候 , 以 检索 key 求 得 哈 希 表 的 下 标 , 从 与 此 下 标 关联 的 链表 中 
检索 元 素 。 如 果 哈 希 函 数 尽 量 返回 均匀 的 值 ， 和 哈 希 表 相 连 的 链表 就 会 变 短 ， 


























自然 就 会 大 幅 地 提高 检索 的 速度 。 
* 不 光 可 以 使 用 整数 ,还 在 编译 器 的 标识 符 管理 和 AWK 、Perl 等 语言 的 哈 希 数组 * 等 实现 中 ,经 常 
可 以 用 字符 串 作 为 下 会 用 到 哈 希 表 *。 


标的 数组 。 


x* Perl 从 Ver.5 开始 ， 将 下 a sb 
汉 希 娄 引 " 和 为 寺 ”5.2 ”案例 学 习 2: 绘图 工具 的 数据 结构 
希 ”….… 虽 说 哈 希 数组 
可 能 是 用 哈 希 的 方式 _ 
实现 的 ,但 是 有 意 地 将 5.2.1 ”案例 的 需 > 
内 部 “实现 手段 ”体现 
在 名 称 这 些 表面 的 东 这 次 让 我 们 考虑 开发 一 个 绘图 工具 ， 来 进一步 实践 。 假 定 程序 的 名 称 为 
西 上 , 对 于 我 来 说 , 有 “X_Draw”。 
点 难以 理解 。 








文件 编辑 “显示 帮助 


xlzlglol 








© 




















图 5-12 ”绘图 工具 “X-Draw” 的 界面 




















# 也 许 让 大 家 失望 了 ,这 
只 是 个 很 简陋 的 给 


下 此 5 在 X-Draw 中 ， 可 以 绘制 下 面 的 图 形 ”， 
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口 折线 (有 任意 个 顶点 的 折线 ) 
口 长 方形 (不 考虑 相对 坐标 轴 倾 斜 的 长 方形 ) 
口 同形 (不 考虑 弧 形 和 椭圆 形 ) 
考虑 到 篇 幅 ， 我 没有 在 书 中 提供 所 有 的 程序 代码 。 不 管 怎么 说 ， 窗 体 程 
序 还 是 非常 依赖 运行 环境 的 。 


这 里 只 会 跟 大 家 说 明 实现 X-Draw“ 数 据 结构 ”的 “ 头 文件 ”部 分 。 





5.2.2 ”实现 各 种 图 形 的 数据 模型 
首先 让 我 们 考虑 一 下 怎么 表示 折线 、 长 方形 、 圆 形 等 图 形 。 


在 第 4 章 已 经 跟 大 家 讨论 过 折线 的 表示 方式 ， 在 这 里 我 们 依然 采用 这 种 
方式 。 





typedef struct { 


double Xi; 
double y 
} Point; 


typedef struct { 


int npoints; 
Point *point; 
} Polyline; 


对 于 长 方形 ， 可 以 使 用 处 于 对 角 线 上 的 两 个 点 来 表示 : 
typedef struct { 
Point minPoint; /* 左下 的 坐标 */ 


Point maxPoint; /* 右上 的 坐标 */ 
} Rectangle; 


对 于 圆 形 ， 可 以 用 圆心 和 半径 来 表示 : 


typedef struct { 











Point center; /* 圆心 */ 
double radius; /* 半径 */ 
} Circle; 
2 充 坐标 系 的 话题 


人 有 下 面 的 疑问 ， 


演 
名 
仿 
二 
a 
GCC 
过 
党 
NN 





章 针 的 使 用 方法 





x* Windows 的 情况 稍微 
有 点 复杂 ， 关 于 这 一 
点 ， 后 面 会 有 说 明 。 


# 在 画笔 工具 的 情况 下 ， 
也 可 能 不 是 这 样 。 


# 有 时 也 称 为 世界 坐标 
系 或 者 逻辑 坐标 系 。 


六 也 可 以 使 用 float。 在 
C 中 , 浮 点 数 类 型 大 多 
都 会 变 成 double， 在 
内 存 充 裕 的 情况 下 ,最 
好 还 是 使 用 double。 


* 这 还 是 要 根据 用 途 来 
决定 ,在 文字 处 理 软 件 
中 绘图 的 时 候 , 因为 文 
字 是 横着 从 左上 写 到 
右 下 的 ,如 果 考 虑 到 这 
一 点 ,将 原点 设 定 在 左 
上 也 许 更 方便 。 


# 最 一 般 的 做 法 ,可 以 采 
用 矩阵 。 





距 ? 坐标 值 怎么 都 搞 成 了 double? 绘制 图 形 的 画布 不 是 用 
像素 来 表示 的 吗 ? 我 记得 坐标 值 应 该 是 int 啊 ? 


确实 ,无论 是 XWindow System 的 图 形 库 Xlib, 还 是 Windows 的 API， 
还 是 Java 的 AWT， 坐 标 值 都 是 以 像素 为 单位 的 整数 。 

尽管 如 此 ， 程 序 内 部 还 是 不 应 该 使 用 以 像素 为 单位 的 整数 值 来 表示 坐 
标 。 如 果 使 用 以 像素 为 单位 的 整数 值 ， 首 先 需 要 解决 的 问题 就 是 如 何 实现 
图 像 的 放大 表示 。 很 多 工具 软件 只 能 做 到 200%、400% 这 样 的 整 倍 地 放大 ， 
使 用 起 来 似乎 不 是 很 方便 。 此 外 ， 对 于 稍稍 复杂 的 图 形 ， 将 它们 组 合 ， 然 后 
通过 操作 顶点 再 将 其 一 会 儿 放 大 ， 一 会 儿 缩 小 ， 图 形 就 变 得 粗糙 不 堪 了 吧 。 

计算 机 上 的 图 形 大 多 都 是 用 像素 (这 种 方式 并 不 是 很 细腻 ) 来 表示 的 ， 
这 是 由 显示 设备 自身 的 条 件 造 成 的 ， 并 不 是 用 户 一 开始 就 想 使 用 像素 来 绘 
制 和 表示 图 形 “。 

因此 ， 正 确 的 解决 方案 应 该 是 ， 首 先 定义 逻辑 上 假定 的 用 户 坐 标 系 ”， 
在 图 形 显示 的 时 机 再 转换 成 设备 坐标 系 (参照 图 5-13 )。 

因为 有 “像素 ”这 样 的 源 于 设备 条 件 的 限制 ， 用 户 坐 标 系 的 坐标 值 使 
用 double 。 另 外 ， 设 备 坐 标 系 的 原点 大 多 在 左上 ， 而 用 户 坐 标 系 是 遵循 数 
学 坐标 将 原点 设置 在 左下 ， 我 认为 这 种 做 法 比较 通俗 易 懂 。 

做 一 些 乘法 运算 和 减法 运算 ， 可 以 简单 地 将 用 户 坐 标 和 设备 坐标 进 
转换 。 

此 外 ，Windows 从 设备 坐标 系 独 立 出 来 一 种 自 定 义 的 逻辑 坐标 系 ， 它 
可 以 以 毫米 为 单位 进行 图 形 绘制 。 但 ……: 此 时 坐标 值 的 类 型 却 为 short 
int， 这 样 的 设计 思路 ， 好 像 完全 超出 了 我 的 理解 能 力 …… 


设备 坐标 系 

















图 5-13 ”坐标 系 变换 
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5.2.3 Shape 型 





5.2.2 节 中 讨论 了 各 图 形 的 表示 方法 。 对 于 绘图 工具 , 还 需要 管理 大 量 各 种 


各 样 的 图 形 进行 管理 。 








在 这 里 ， 我 们 使 用 Shape 这 样 一 个 结构 体 来 表示 一 个 “图 形 ”。 


对 于 “图 形 ” 来 说 ， 它 应 该 有 颜色 这 样 的 属性 。 如 果 内 部 被 涂 满 ， 那 就 
还 有 填充 方式 这 样 的 属性 。 下 面 使 用 枚 举 的 方式 来 表示 这 些 属 性 。 








typedef enum { 


COLOR_BLACK， /* 
COLOR_BLUE, /* 
COLOR_RED, /* 


COLOR_MAGENTA, /* 


COLOR_GREEN, /* 
COLOR_CYAN, /* 
COLOR_YELLOW, /* 
COLOR_WHITE /* 

} Color; 

typedef enum { 
FILL_NONE, /* 
FILL_SOLID, /* 
FILL_HATCH, /* 


FILL_CROSSHATCH /* 
} FillPattern; 





























黑 */ 
蓝 */ 
红 */ 
品 红 */ 
绿 */ 
青 */ 
黄 */ 

白 */ 


不 填充 */ 
实心 填充 */ 
针线 图 案 填 充 */ 





交叉 图 案 填 充 */ 


在 一 开始 我 们 是 无 法 预测 图 形 的 数量 的 ， 所 以 考虑 使 用 mal1ocO) 为 
站 


考虑 到 以 下 原因 ， 我 们 选择 双向 链表 ， 





























口 对 所 有 的 图 形 进 行 重 绘 的 时 候 ,“ 从 后 面 的 图 形 开始 顺序 地 ”绘制 , 能 
够 以 正确 的 顺序 表示 各 图 形 。 
口 使 用 按 下 鼠标 的 方式 选择 图 形 的 时 候 ， 需 要 从 “前 面 的 图 形 开 始 顺序 








地 ”检查 哪个 图 形 才 是 选择 对 象 "。 和 





过 鼠标 来 选择 图 形 


对 于 Shape, 它 可 能 代表 折线 ， 可 能 代表 长 方形 , 也 可 能 代表 圆 , 使 用 C “(pick ), 经 常 需要 运用 





























的 结构 体 和 共用 体 来 表示 Shape 是 惯用 的 手法 (下面 就 是 实际 的 例子 )。 儿 何方 法 来 计算 距离 。 


根据 上 面 的 分 析 ， 可 以 用 下 面 的 方式 来 表示 Shape 类 型 : 





typedef enum { 
POLYLINE_SHAPE ， 
RECTANGLE_SHAPE, 
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CIRCLE_SHAPE 
} ShapeType ; 


typedef struct Shape_tag { 
/* 画笔 〈 轮 廊 ) 的 颜色 */ 
Color pen_color; 
/* 填充 样式 ，FILL_NONE 的 时 候 不 填充 */ 
FillPattern fill_pattern; 
/* 填充 颜色 */ 
Color fill_color; 
/* 图 形 的 种 类 */ 
ShapeType type; 


union { 
Polyline polyline; 
Rectangle rectangle; 
Circle circle; 
}u; 


struct Shape_tag *prev; 
struct Shape_tag *next; 
} Shape; 


ShapeType 是 一 个 用 于 区 别 Shape 种 类 的 枚 举 类 型 ， 根 据 Shape 的 成 员 
type， 可 以 判定 Shape 的 种 类 。 

假设 ,将 指向 Shape 的 链表 的 头 指 针 放 到 head 这 样 一 个 变量 中 ,“ 绘 制 
所 有 图 形 的 程序 ”大 致 可 以 写成 下 面 这 样 : 


Shape *pos; 
































for (pos = head; pos != NULL; pos = pos->next) { 
switch (pos->type) { 

case POLYLINE_SHAPE : 
/* 调用 绘制 折线 的 函数 */ 
draw_polyline(pos); 
break; 

Case RECTANGLE_SHAPE: 
/* 调用 绘制 长 方形 的 函数 */ 
draw_rectangle(pos); 
break; 

Case CIRCLE_SHAPE : 
/* 调用 绘制 圆 形 的 函数 */ 
draw_circle(pos); 
break ; 

default: 
assert(0); 


} 
因为 是 从 链表 的 第 一 个 元 素 开 始 绘 制图 形 ， 所 以 链表 后 面 的 元 素 会 被 表 
示 在 前 面 。 


在 大 多 的 绘图 工具 中 ， 通 过 点 击 鼠 标 选择 一 个 图 形 ， 然 后 可 以 将 它 移动 
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到 最 前 面 或 最 后 面 。 此 时 ， 需 要 将 图 形 对 应 的 元 素 在 链表 中 进行 移动 ， 图 形 
要 移动 到 最 前 面 ， 元 素 就 要 移动 到 链表 的 末尾 ; 图 形 要 移动 到 最 后 面 ， 元 素 
就 要 移动 到 链表 的 最 前 面 。 


做 这 样 的 元 素 移动 ， 那 是 链表 的 强项 。 





























5.2.4 讨论 一 一 还 有 别 的 方法 吗 


到 这 里 为 止 我 们 讨论 过 的 方法 好 像 都 还 不 错 ， 但 还 是 让 我 们 再 想 想 有 没 
有 更 好 的 解决 方案 。 


可 能 有 人 会 有 下 面 的 想法 ， 


做 所 知道 的 绘图 工具 中 ,经常 需 要 的 功能 倒 不 是 什么 绘制 折线 ， 

绘制 “线段 ” 倒 挺 常 见 的 。 虽 然 菜单 中 也 有 折线 ， 但 是 经 常 使 用 的 

是 “线段 "7。 因 此， 是 不 是 应 该 也 有 一 个 Line 这 样 的 类 型 呢 ? 

我 平时 使 用 UNIX 的 tgif 这 个 工具 比较 多 一 些 ， 在 这 个 工具 的 菜单 中 前 
面 出 现 的 就 不 是 “线段 "， 而 是 “折线 ”。 确 实 ， 在 Windows 和 Macintosh 中 的 
绘图 工具 的 菜单 中 出 现 的 大 多 还 是 “线段 ”。 

“线段 ”经 常 出 现在 菜单 的 最 前 面 ， 证 明 对 于 用 户 来 说 ， 相 比 “ 折 线 ”， 
绘制 “线段 ”功能 的 使 用 会 更 加 频繁 "。 但 即使 是 这 样 ， 如 果 用 户 选 择 了 位 于 






































线 "， 那 么 就 不 需要 特地 再 摘出 一 个 什么 Line 类 型 了 吧 。 


即使 Windows 中 的 绘图 工具 总 是 将 折线 功能 藏 在 菜单 层次 结构 的 里 面 ， 
但 这 种 功能 毕竟 是 存在 的 ， 并 且 ， 作 为 折线 的 修正 功能 ， 肯 定 也 会 有 “ 增 减 
折线 顶点 的 功能 ” 吧 。 此 外 ， 怒 怕 也 会 有 增加 线段 的 项 点 的 功能 吧 。 因 此 ， 
线段 的 内 部 使 用 折线 来 实现 ， 应 该 是 一 个 不 错 的 方案 。 如 果 定 义 了 新 的 Line 
类 型 ， 就 又 需要 开发 一 个 “一 旦 在 Line 上 添加 了 项 点， 就 要 将 它 转换 成 
Polyline 类 型 ”这 样 的 功能 了 。 


这 样 说 来 ， 是 不 是 有 人 又 会 有 下 面 的 想法 : 
咽 ， 长 方形 可 以 用 顶点 数 为 的 折线 来 表示 ， 那 Rectangle 类 
型 是 不 是 也 可 以 不 要 了 ? 
这 可 不 行 ! 假设 我 们 选中 一 个 顶点 进行 拖 搜 ， 对 于 长 方形 和 折线 图 形 如 
何 变化 ,我们 的 期 待 肯定 是 不 一 样 的 吧 ? 




















上 



























































* 到 底 是 不 是 这 样 ,我 还 
真 说 不 好 。 但 至 少 作为 
软件 设计 者 ,肯定 应 该 
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* 当然 也 可 以 使 用 void， 
但 此 时 完全 不 知道 指 
针 指 向 什么 类 型 ,所 以 
从 代码 的 可 读 性 上 考 
虑 ,还 是 应 该 使 用 指针 
的 共用 体 。 





让 我 们 再 把 目光 投向 内 部 实现 ， 此 时 也 许 又 会 出 现下 面 的 观点 : 


折线 必须 要 实现 “ 增 减 顶点 ”的 功能 ， 所 以 对 于 折线 的 Point， 
不 应 该 用 可 变 长 数组 ， 而 应 该 使 用 链表 来 表示 。 

追加 顶点 的 时 候 ， 往 往 是 在 顶点 和 顶点 之 间 插 入 新 顶点 ， 因 此 ， 
相 比 使 用 数组 ， 链 表 的 插入 操作 更 简单 。 


这 倒是 一 个 比较 麻烦 的 问题 ， 不 能 断然 说 哪个 观点 就 是 正确 的 。 


但 是 ，Point 类 型 只 包含 两 个 double 元 素 ， 相 对 来 说 比较 小 。 对 于 绘图 
工具 ， 折 线 顶 点 的 数量 也 是 可 以 预期 的 。 因 此 ，Point 的 数组 也 不 会 变 得 很 
大 , 可 以 说 不 会 发 生 导致 执行 效率 低下 的 现象 ( 追加 顶点 时 , 使 用 reallocQO 
不 断 地 分 配 内 存 区 域 ， 或 者 在 插入 顶点 时 ， 整 体 移 动 后 方 的 元 素 )。 倒 是 为 了 
使 用 链表 , 在 成 员 中 追加 指针 , 或 者 为 每 一 个 Point 使 用 mal1loc(0) 分 配 管理 
空间 这 样 的 行为 反而 会 引起 严重 的 问题 。 


如 果 对 mal1ocGO) 的 管理 区 域 比 较 在 意 的 话 ， 可 以 使 用 可 变 长 结 
构 体 来 构造 Poly1ine 类 型 呀 ! 


对 啊 ， 如 果 使 用 4.3.1 节 中 介绍 的 技巧 ， 就 可 以 不 用 调用 mal11oc() 为 
Point 数组 来 分 配 新 的 内 存 区 域 了 ! ……… 但 是 ， 由 于 Polyline 不 是 Shape 
结构 体 的 最 后 成 员 ， 一旦 使 用 这 个 技巧 ， 就 会 破坏 掉 prev 和 next 的 数据 。 


调整 一 下 Shape 结构 体 成 员 的 顺序 看 上 去 好 像 可 行 ， 但 折线 的 顶点 个 数 
一 且 发 生变 化 ， 就 必须 为 每 一 个 Shape 调用 realloc()， 当 前 的 Shape 的 地 
址 也 会 随 之 发 生变 化 (有 可 能 )。 由 于 Shape 在 双向 链表 中 ， 它 被 前 后 两 个 
Shape 所 指向 ,一旦 移动 了 地 址 ， 自 然 麻 烦 也 随 之 而 来 。 因 此 ， 这 个 方法 也 
不 靠 谱 。 


前 面 我 们 使 用 了 共用 体 。 共 用 体会 根据 其 最 大 的 一 个 成 员 来 分 
配 内 存 空 间 ， 这 是 不 是 有 点 浪费 内 存 ? 

























































































倒是 有 点 道理 。 但 是 这 次 的 Poly1ine、Rectangle 和 Circle 的 大 小 ， 
在 大 多 数 处 理 环境 中 都 是 差不多 的 。 

如 果 这 些 类 型 的 大 小 完全 不 同 ， 当 然 也 不 能 无 视 内 存 的 浪费 。 此 时 ， 也 
可 以 考虑 使 用 “指针 共用 体 ”“, 然后 通过 malloc() 给 Polyline、 Rectangle 
和 Circle 分 配 内 存 区 域 。 


typedef struct Shape_tag { 
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union { 
Polyline *polyline; 
Rectangle rectangles | Hoan 
Circle *Circle; 

ui 


struct Shape_tag *prev; 
struct Shape_tag *next; 
} Shape; 





此 时 , 刚才 的 “应 该 把 Poly1ine 构造 成 可 变 长 结构 体 ” 这 种 方案 也 就 具 
备 了 现实 的 意义 。 























但 是 ， 正 如 刚才 描述 的 那样 ， 因 为 Polyline、Rectangle、Circle 的 
大 小 并 没有 很 大 差异 ,考虑 到 使 用 mal11oc0) 需 要 额外 的 管理 内 存 ， 或 者 消耗 
在 调用 free() 上 的 精力 ， 所 以 我 不 会 考虑 通过 别 的 方式 分 配 内 存 。 





在 Shape 中 放 进 prev 和 next 的 做 法 也 让 人 觉得 不 太 自 然 。 
Shape 只 是 一 个 “图 形 ”， 使 用 链表 来 管理 还 是 使 用 数组 来 管理 ， 这 
是 使 用 者 的 自由 ， 为 什么 我 们 一 开始 就 先入 为 主 地 认为 Shape 天 生 
就 应 该 通过 双向 链表 来 管理 呢 ? 这 一 点 本 身 就 很 奇怪 。 











这 个 批评 不 无 道理 ,我 们 经 常 将 链表 和 本 来 无 关 的 Shape 放 在 一 起 使 用 ， 
此 时 有 人 会 想 : 那 就 将 prev 和 next 设 定 为 NULL 好 了 。 但 将 原本 就 不 需要 
的 对 象 作为 成 员 ， 你 不 觉得 奇怪 吗 ? 


因此 ,让 我 们 来 看 看 下 面 这 个 方案 。 这 个 方案 不 需要 在 Shape 中 放 入 prev 
和 next， 而 是 像 下 面 这 样 定义 一 个 LinkableShape 类 型 ，Shape 作为 这 个 
类 型 的 一 个 成 员 ( 参照 图 5-14 )。 








LinkableShape 





图 5-14 Shape 的 持 有 方式 (其 2 ) 


typedef struct LinkableShape tag { 
Shape shape; 
struct LinkableShape_tag *prev; 
struct LinkableShape_tag *next; 
} LinkableShape; 


或 者 写成 这 样 ， 
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typedef struct LinkableShape tag { 
Shape *shape; 
struct LinkableShape_tag *prev; 
struct LinkableShape_tag *next; 
} LinkableShape; 
在 图 5-14 的 实现 中 , 保存 Shape 到 链表 的 时 候 , 需要 将 Shape 整个 复制 
到 链表 中 。 复 制 这 样 的 操作 肯定 会 改变 Shape 的 地 址 ， 后 果 就 是 丢失 了 指向 
Shape 的 指针 。 


如 果 采 用 图 5-15 的 方法 , 就 没有 这 样 的 担心 了 。 但 会 出 现 另 外 一 个 问题 ; 
随 着 mallocO 调 用 次 数 的 增加 ， 会 浪费 一 些 管理 区 域 的 内 存 ， 而 且 也 要 在 
free() 调 用 上 花费 相当 的 精力 。 





























LinkableShape 





图 5-15 ”Shape 的 持 有 方式 (其 3) 





但 是 ， 对 于 本 例 这 样 的 结构 体 ， 考 虑 到 实现 简单 ,在 Shape 中 放 入 prev 
和 next 其 实 也 没有 什么 问题 。 


通过 上 面 种 种 分 析 ， 我 们 应 该 能 体会 到 ， 对 于 数据 结构 的 设计 ， 其 实说 
到 底 就 是 权衡 利 浆 的 过 程 ， 根 本 就 不 存在 所 谓 的 “ 银 弹 ””。 对 于 数据 的 特征 
以 及 使 用 方式 进行 细致 的 分 析 ， 并 且 选 择 最 合适 的 手法 ， 这 是 程序 设计 者 的 
责任 。 同 时 ,设计 者 还 要 熟知 malloc() 、realloc() 的 内 部 实现 机 制 。 
另外， 设计 者 不 但 需要 根据 现状 决定 使 用 方法 ， 还 要 考虑 到 将 来 的 扩展 
性 ， 以 及 执行 速度 、 内 存 使 用 这 两 个 方面 的 最 优化 设计 。 最 后 ， 还 要 考虑 到 
编程 的 可 行 性 。 在 设计 数据 结构 这 一 点 上 ， 最 能 体现 设计 者 的 水 平 。 
























































@ 银 弹 : 出 自 《 人 月 神话 》， 指 那些 可 以 解决 所 有 问题 的 方法 论 ， 可 以 理解 成 “一 招 鲜 ”。 
译 者 注 
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补 
名 充 什么 都 放 的 链表 


进一步 考虑 图 5-15 的 方案 ， 应 该 还 有 以 下 的 方法 : 
typedef struct Linkable_tag { 
void *object; 
struct Linkable_tag *prev; 
struct Linkable_tag *next; 
} Linkable; 
Linkable 的 成 员 交 量 object 的 类 型 是 void*, 所 以 它 可 以 指向 任意 类 型 。 
也 就 是 说 ， 在 Linkable 类 型 不 依赖 于 Shape 类 型 ， 它 可 以 存储 任意 类 型 。 
大 部 分 情况 下 ， 双 向 链表 都 会 拥有 指向 初始 元 素 和 末尾 元 素 的 指针 ， 
为 了 能 够 持 有 整个 双向 链表 ， 有 必要 定义 下 面 这 样 的 类 型 ; 
/* 持 有 全 体 双向 链表 的 类 型 */ 
typedef struct { 
Linkable *head; /#*# 初始 的 元 素 */ 
Linkable xtail; /* 末尾 的 元 素 */ 
} LinkedList; 
双向 链表 是 使 用 很 频繁 的 一 种 数据 结构 ， 但 使 用 双向 链表 进行 开发 的 
时 候 ， 每 次 都 重复 做 “在 某 元 素 前 面 插入 一 个 元 素 ” 这 样 无 聊 的 编程 ， 既 
浪费 时 间 又 容易 引起 bug。 
此 时 , 可 以 使 用 LinkedList 或 者 Linkable 这 样 的 类 型 ， 如 果 将 双向 
链表 的 常用 操作 整理 成 函数 库 来 加 以 利用 ,就 可 以 省 去 那些 无 聊 的 重复 编程 。 
可 是 ， 在 大 型 项 目 中 ， 这 个 方法 也 有 致命 的 弱点 。 造 成 这 个 弱点 的 起 
因 就 是 “什么 都 可 以 扔 进去 ”。 向 保存 Shape 的 链表 中 无 限制 地 放 入 “和 白 蔓 
卜 ” 还 是 “胡萝卜 ”总 是 会 出 问题 的 〈 编 译 时 不 会 出 错 )。 
此 外 ,也 完全 不 知道 LinkedList 中 究竟 保存 了 什么 ,假设 ,使 用 Point 
的 链表 来 表示 Polyline: 
typedef struct Point_tag { 
double x; 
double y; 
struct Point_tag *prev; 


struct Point_tag *next; 
} Point; 


typedef struct { 
Point *head; 
Point *tail; 
} Polyline; 


看 一 眼 上 面 的 代码 ， 基 本 可 以 知道 数据 结构 中 的 内 容 。 


数据 结构 
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* java.lang.0bject 
相当 于 C 的 void*, 它 
们 都 是 最 那 恶 的 指针 。 


六 C# 里 也 似 没有 …… 


* 现在 ,也 出 现 谋 入 泛 型 
功能 的 Java 编译 器 。 
(参照 http:// www.cs. 
bell-labs.com/who/wad- 
ler/gj )。( 第 8 印 注 : 
在 JDK1.5 中 被 正式 采 
用 。) 


typedef struct { 
LinkedList list; 

} Polyline; 

如 果 这 样 ， 那 就 真 不 知道 1ist 是 什么 东 东 了 。 就 算 好 不 容易 搞 明 白 它 
是 个 链表 ， 你 也 无 法 知道 它 其 实 是 个 “Point 类 型 的 链表 ”( 除非 你 加 上 注 
释 )。 这 对 程序 的 可 读 性 和 可 维护 性 产生 了 恶劣 的 影响 。 

顺便 介绍 一 下 ，Java 的 集合 类 库 中 也 有 和 此 处 介绍 的 void* 方 式 类 似 
的 实现 。 

对 于 C 这 样 的 骨灰 级 语言 ， 已 经 没有 必要 解决 这 样 的 问题 了 。 在 一 些 
最 新 的 语言 中 ， 为 了 持续 维持 LinkedList 的 通用 性 和 杜绝 void* 的 危险 
性 ， 实 现 了 叫做 “ 泛 型 ( genericity )” 和 “模板 (template )” 的 功能 。 

Java 中 缺少 这 么 一 个 重要 的 功能 ， 真 是 让 人 不 解 。 

对 于 C++、Ada 这 样 可 以 操作 对 象 实体 的 语言 ， 泛 型 伴随 着 复制 执行 
代码 的 问题 。 但 是 ， 对 Java 这 样 只 能 使 用 指针 的 语言 来 说 ， 只 要 在 编译 时 
加 入 一 些 检查 就 可 以 简单 地 实现 这 个 功能 。 


5.2.5 图 形 的 组 合 
几乎 在 所 有 的 绘图 工具 中 ， 都 可 以 将 几 个 图 形 进行 组 合 ， 然 后 当 作 一 个 
图 形 去 操作 。 本 节 中 也 考虑 将 这 个 功能 在 X-Draw 中 实现 。 


首先 定义 一 个 Group 类 型 。 虽 然 Group 类 型 需要 包含 很 多 Shape， 但 是 
Shape 自身 可 以 实现 双向 链表 ， 所 以 只 要 在 Group 中 定义 指向 初始 元 素 和 最 
后 元 素 的 指针 就 可 以 了 。 


typedef struct { 

















Shape *head; 
Shape *tail; 
} Group; 





所 谓 图 形 组 合 就 是 “将 几 个 图 形 组 合成 一 个 图 形 ”的 功能 。 被 组 合 到 一 
起 的 图 形 组 ， 其 自身 也 可 以 说 是 一 种 “图 形 ”。 因 此 ， 可 以 考虑 将 “Group” 
加 入 到 枚 举 类 型 shapeType 中 。 














typedef enum { 
POLYLINE_SHAPE ， 
RECTANGLE_SHAPE ， 
CIRCLE_SHAPE ， 
GROUP_SHAPE 

} ShapeType ; 




















GD C# 从 .NET2.0 开始 也 具备 了 泛 型 和 模板 的 功能 。 译 者 注 
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相 提 


色 就 
会 发 
的 颜 


但 是 , 可 能 有 人 觉得 这 么 做 有 些 不 和 谐 , 让 Group 和 Polyline、Rectangle 


并 论 真 的 有 些 奇 怪 。 











因为 Group 也 是 一 个 Shape， 所 以 我 倒 认 为 这 么 做 未 尝 不 可 。 只 是 对 于 
Shape 来 说 ， 它 虽然 有 自己 的 颜色 或 者 填充 图 案 ， 但 “组 合 后 的 图 形 ” 的 颜 
不 是 固定 的 。 将 图 形 进 行 组 合 ， 色 ， 整 组 的 图 形 颜色 都 

















生变 化 。 镍 除了 图 形 的 组 合 ， 其 每 一 个 图 形 都 不 会 变 回 原来 
色 ， 一 能 说 这 是 一 个 “变更 组 合 图 形 的 颜色 ”的 功能 ， 准 确 地 应 











该 说 这 是 一 


和 6 


个 “变现 组 内 所 有 图 形 前 颜色 ” 的 功能 。 





在 这 里 ， 让 我 们 首先 把 Shape 分 类 成 折线 、 长 方形 这 样 的 “基本 图 形 ” 


组 。 


typedef enum { 
PRIMITIVE_SHAPE ， 
GROUP_SHAPE 

} ShapeType ; 


typedef struct Shape_tag { 


ShapeType type ; 
union { 
Primitive primitive; 
Group group; 
Fu 


struct Shape_tag *prev; 
struct Shape_tag *next; 
} Shape; 


然后 ， 将 到 现在 为 止 Shape 中 持 有 的 数据 放 到 Primitive 类 


typedef enum { 
POLYLINE_PRIMITIVE, 
RECTANGLE_PRIMITIVE, 
CIRCLE_PRIMITIVE 

} PrimitiveType; 


typedef struct { 
/* 画笔 (轮廓) 的 颜色 */ 
Color pen_color; 
/* 填充 样式 ，FILL_NONE 的 时 候 不 填充 */ 
FillPattern fill_pattern; 
/* 填充 颜色 */ 
Color fill_color; 
/* 图 形 的 种 类 */ 
PrimitiveType type ; 





型 中 。 
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union { 
Polyline polyline; 
Rectangle rectangle; 
Circle circle; 


}u; 
} Primitive; 
此 时 ,包含 “组 ”的 Shape 数据 结构 ， 就 变 成 图 5-16 的 形式 。 看 上 去 好 
像 和 5.1.6 节 中 列举 的 例子 有 些 不 同 ， 其 实 它 也 是 一 种 树 结构 。 





Shape 


Primitive Primitive 








图 5-16 包含 “组 ”的 Shape 数据 结构 











包含 到 此 为 止 涉 及 的 所 有 类 型 的 头 文 件 ， 如 代码 清单 5-15 所 示 ， 


代码 清单 5-15 Shape.h 





#ifndef SHAPE_H_INCLUDED 
#define SHAPE_H_INCLUDED 


COLOR_BLACK， /* 黑 */ 
COLOR_BLUE, /* 蓝 */ 


1 
2 
3: 
4: typedef enum { 
he 
6 
7 COLOR_RED ， /* 红 */ 
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COLOR_MAGENTA， 
COLOR_GREEN, 
COLOR_CYAN, 
COLOR_YELLOW, 
COLOR_WHITE 

} Color; 


typedef enum { 
FILL_NONE, 
FILL_SOLID, 
FILL_HATCH, 
FILL_CROSSHATCH 
} FillPattern; 


typedef enum { 
POLYLINE_PRIMITIVE, 
RECTANGLE_PRIMITIVE, 
CIRCLE_PRIMITIVE 

} PrimitiveType; 


typedef struct { 


double Xs 
double y; 
} Point; 


typedef struct { 


int npoints; 
Point *point; 

} Polyline; 

typedef struct { 
Point minPoint; 
Point maxPoint; 


} Rectangle; 


typedef struct { 


Point center; 
double radius; 
} Circle; 


typedef struct { 
/* 画笔 (轮廓 ) 的 颜色 */ 
Color pen_color; 


/* 填充 样式 ，FILL_NONE 的 时 候 不 填充 */ 


FillPattern fill_pattern; 
/* 填充 的 颜色 */ 

Color fill_color; 
/* 图 形 的 种 类 */ 





PrimitiveType type ; 

union { 
Polyline polyline; 
Rectangle rectangle; 
Circle circle; 


}u; 


/* 品 红 */ 
/* 绿 */ 
/* 青 */ 
/* 黄 */ 
[es 和 白 */ 


/* 不 填充 */ 

/* 实心 填充 */ 

/* 填充 针线 图 案 */ 
/* 填充 交叉 阴影 线 */ 





/* 左下 的 坐标 */ 
/* 右上 的 坐标 */ 





/* 国 心 w/ 
/* 半径 */ 
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} Primitive; 
typedef struct Shape_tag Shape; 


typedef struct { 
Shape *head; 
Shape *tail; 
} Group; 


typedef enum { 
PRIMITIVE_SHAPE ， 
GROUP_SHAPE 

} ShapeType 


struct Shape_tag { 


ShapeType type; 
union { 
Primitive primitive; 
Group group; 
ui 


struct Shape_tag *prev; 
struct Shape_tag *next; 


}3 


#endif /* SHAPE_H_INCLUDED */ 

















Shape 类 型 的 定义 依赖 于 Group 类 型 ，Group 类 型 的 定义 又 依赖 于 指向 
Shape 类 型 的 指针 , 因此 它们 之 间 形 成 了 相互 依赖 的 关系 。 第 64 行 利用 不 完 
全 类 型 声明 了 Shape 类 型 。76 行 以 后 给 struct Shape_tag 定义 了 实际 的 








至 于 使 用 此 数据 结构 的 程序 ， 比 如 “绘制 所 有 图 形 ” 的 程序 ， 如 代码 清 
单 5-16 所 示 。 


代码 清单 5-16 draw_shape.c 








(‘OooOoONOUMUAWDTDPp 


#include <stdio.h> 
#include <assert.h> 
#include "shape.h" 


void draw_polyline(Shape *shape); 
void draw_rectangle(Shape *shape); 
void draw_circle(Shape *shape); 


void draw_primitive(Shape *shape) 
{ 
switch (shape->u.primitive.type) { 
case POLYLINE_PRIMITIVE : 
/* 调用 绘制 折线 的 函数 */ 
draw_polyline(shape); 
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15 : break ; 

16: Case RECTANGLE_PRIMITIVE: 
17: /* 调用 绘制 长 方形 的 函数 */ 
18 : draw_rectangle(shape); 
19 : break ; 

20 : Case CIRCLE_PRIMITIVE : 

21: /* 调用 绘制 圆 的 函数 */ 

2 draw_polyline(shape); 
2.33 break ; 

24: default: 

2:5. assert(0); 

26 : } 

275. 让 

28: 

29: void draw_all_shapes(Shape *head) 
30: {{ 

31: Shape *pos; 

32.: 

33: for (pos = head; pos != NULL; pos = pos->next) { 
34: switch (pos->type) { 

35: case PRIMITIVE_SHAPE : 
36 : draw_primitive(pos); 
37: break; 

38: Case GROUP_SHAPE : 

39 : draw_all_shapes(pos->u.group.head); 
40: break; 

41: default: 

42: assert(0); 

43: } 

44: } 

45: 了】 








图 形 的 具体 绘制 方式 依赖 于 各 窗口 图 形 系统 ， 在 代码 清单 5-16 的 多 





和 5~7 





行 ， 假定 了 传人 指向 Shape 类 型 的 指针 就 可 以 绘制 对 应 图 形 的 几 个 函数 。 

















这 种 需要 遍历 树 结构 的 情况 下 ， 使 用 递归 调用 是 常用 的 手法 。 








5.2.6 ”继承 和 多 态 之 道 
































第 39 行 通过 对 draw_al11_shapes (0) 递归 调 用 来 实现 图 形 组 合 的 绘制 ,在 


本 书 是 一 本 关于 C 语 言 的 书籍 ， 所 以 到 现在 为 止 ， 只 是 在 C 语言 的 功能 





范围 内 讨论 了 绘图 工具 的 数据 结构 。 
其 实 ， 前 面 介绍 的 方法 中 存在 比较 严重 的 问题 ， 它 就 是 : 





为 了 区 别处 理 各 种 图 形 ，switch case 这 样 的 语句 散落 在 程序 


的 各 个 角落 。 


x* 从 常识 来 说 , 非 static 
函数 的 原型 声明 不 应 
该 写 在 .c 文 件 中 。 外 部 
函数 的 原型 声明 必定 
写 在 头 文件 中 ,被 多 个 
头 文件 共用 。 此 处 的 例 
程 ,只 是 为 了 通过 编译 
(不 出 警告 ), 暂 时 做 了 
这 样 的 原型 声明 。 
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* 在 代码 清单 5-16 中 的 
default 中 的 assertO) ， 
可 以 在 早期 就 发 现 这 
种 疏漏 。 


代码 清单 5-16 的 第 11 行 开始 出 现 的 switch case, 不 只 是 出 现在 图 形 绘 
制 的 时 候 ， 在 使 用 鼠标 选择 图 形 而 进行 距离 计算 的 时 候 ， 以 及 将 整体 图 形 保 
存在 文件 中 , 或 者 从 文件 中 加 载 图 形 的 时 候 ， 都 会 出 现 switch case 的 身影 。 


像 这 样 在 程序 中 到 处 写 switch case 的 编程 风格 , 一旦 增加 了 一 种 图 形 ， 
就 必须 在 分 散在 各 处 的 switch case 中 挨个 追加 case。 不 但 麻烦 ， 还 很 容易 
下 漏 "。 


在 C++ 或 者 Java 等 面向 对 象 的 语言 中 ， 通 过 使 用 继承 和 多 态 ， 可 以 在 很 
多 实现 中 回避 switch case。 


简单 地 说 ， 面 向 对 象 的 语言 有 以 下 这 些 功 能 : 


@ 在 面向 对 象 的 类 ( 粗暴 地 说 ， 它 类 似 于 结构 体 ) 中 , 不 但 可 以 有 变量 ， 

还 可 以 放 入 函数 ， 这 些 函 数 我 们 称 为 “方法 ”。 

@ 在 面向 对 象 的 语言 中 ， 可 以 对 现 有 的 类 进行 扩展 ， 做 出 一 个 新 的 类 ， 这 
种 行为 被 称 为 继承 (inheritance )。 比 如 ，Polyline 继承 了 Shape。 

@ 继承 类 的 方法 可 以 覆盖 〈override ) 被 继承 类 的 方法 。 

使 用 这 个 功能 ， 可 以 将 draw0O 这 个 方法 放 到 Shape 中 ， 然 后 针对 

Polyline 或 者 Rectangle 做 draw0) 的 具体 实现 , “绘制 所 有 图 形 的 程序 ” 

就 可 以 大 致 写成 下 面 这 样 (C++ 风格 ): 


for (pos = head; pos != NULL; pos = pos->next) { 
pos->draw(); 一 一 调用 pos 指向 的 Shape 的 draw() 方 法 
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} 
这 么 写 的 话 ， 如 果 pos 是 Poly1ine 就 自动 调用 Polyline 的 draw() 方 
法 ， 如 果 pos 是 Rectangle 就 自动 调用 Rectangle 的 draw() 方 法 。 就 没有 
必要 再 使 用 switch case 来 区 分 处 理 了 。 这 样 的 特征 我 们 称 为 多 态 
(polymorphism )。 


如 果 想 要 用 C 来 实现 多 态 ， 可 以 考虑 让 每 一 个 Shape 持 有 一 个 指向 结构 
体 的 指针 ， 而 在 结构 体 中 包含 函数 指针 。 这 样 的 做 法 很 流氓 。 其 实 ， 在 X 
Window System 的 GUI 工具 包 Xt Intrinsics 和 GTK+ 中 ， 就 是 通过 这 样 的 方法 
勉强 地 实现 了 多 态 。 但 这 种 方式 毕 竞 还 是 太 暴 力 了 ， 在 一 般 开 发 中 还 是 建议 
大 家 老 老实 实地 使 用 switch case。 


编程 语言 是 在 不 断 发 展 的 ， 每 一 种 新 的 语言 都 会 推出 一 些 有 用 的 新 功能 。 
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补 
名 充 真 的 可 以 将 draw() 放 到 Shape 中 吗 ? 


将 draw() 方 法 定义 到 Shape 中 ,然后 利用 多 态 的 特征 将 处 理 分 开 , 很 
多 面向 对 象 的 入 门 书 都 将 这 个 案例 作为 例题 来 讲解 。 比 如 ， 在 《编程 语言 
C++ 第 3 版 加》 中 ， 就 利用 Shape 的 例子 来 说 明 多 态 。 

在 我 看 来 ， 对 于 最 多 几 万 行 代码 的 小 规模 程序 ,“ 在 Shape 中 定义 
draw()” 这 种 手法 还 是 很 有 效 的 。 可 是 ， 如 果 是 像 CAD 这 样 庞大 的 系统 ， 
有 时 就 需要 尽量 回避 这 种 手法 。 

定义 了 Shape 等 类 型 的 shape.h， 有 是 全 体 程 序 中 最 主要 的 头 文 件 ， 其 中 
的 大 量 内 容 被 所 有 的 程序 引用 。 因 此 , 必须 非常 谨慎 地 定义 shape.h 的 内 容 ， 
因为 一 旦 内 容 确定 了 ， 以 后 再 修改 就 不 是 那么 简单 的 了 。 


因为 draw() 方 法 的 实现 特别 依赖 于 窗口 的 图 形 系统 ， 如 果 将 draw() 
方法 放 到 shape.h 中 ， 就 会 发 生 严重 的 可 移植 性 的 问题 。 像 C++ 那样 将 方法 
的 声明 和 实现 分 开 还 好 ， 如 果 是 Java 那 就 比较 麻烦 了 。 


正 是 这 种 情况 下 我 们 才 要 考虑 设计 模式 I 中! 如 果 想 要 不 依 
存 窗口 图 形 系统 ， 为 什么 不 考虑 使 用 Bridge 模式 呢 ? 


可 能 有 人 会 有 上 面 的 想法 。 可 是 ， 抽 象 出 可 以 对 应 现实 中 所 有 窗口 图 
形 系 统 的 绘图 接口 ， 是 非常 困难 的 。 比 如 在 如 今 的 图 形 系统 (X Window、 
Windows、Java AWT ) 中 ,“ 将 线 从 这 里 画 到 那里 ”这 样 的 即时 绘图 ， 和 很 
久 以 前 作为 标准 的 GKS 就 有 概念 上 的 差异 。 








因此 ， 在 根本 概念 发 生变 化 的 时 候 ， 对 于 程序 这 方面 ， 废 弃 掉 原来 的 
程序 ， 重 新 开发 也 许 就 能 解决 问题 。 但 是 ， 相 比 程序 ， 系 统 数据 的 生命 周 
期 要 长 很 多 ,所 以 需要 尽 可 能 不 改变 原来 的 数据 结构 ( 这 里 就 是 指 shape.h )。 

另外 ,在 CAD 等 系统 使 用 的 数据 中 ,图 形 ( 形状 ) 数 据 不 只 是 被 draw() 
所 用 。 比 如 ,利用 CAD 设计 出 的 图 形 会 被 保存 在 文件 中 ,其 他 的 应 用 程序 
也 可 以 读 取 这 些 文 件 中 的 数据 ， 并 且 可 以 对 它们 进行 解析 。 对 于 解析 的 处 
理 来 说 , shape.h 也 许 是 不 可 缺少 的 , 但 是 其 中 的 draw() 其 实 是 完全 用 不 上 
的 。“ 数 据 ” 人 往往 会 超越 原本 设计 其 “数据 结构 ”的 人 的 意志 ,被 很 多 其 他 
的 应 用 程序 使 用 。 




















GD Java 中 根本 没有 头 文件 ,在 这 里 ， 原 著作 者 先 把 话题 指向 头 文件 ， 然 后 拿 C++ 和 Java 进 
行 对 比 ， 这 是 不 公平 的 。 况 且 Java 中 也 可 以 通过 interface 将 声明 和 实现 分 开 。 在 此 书 翻 
译 过 程 中 ， 译 者 认为 原著 作者 对 Java 有 着 很 深 的 偏见 和 误解 。 一 一 译 者 注 




















党 


Graphical Kemel System ， 
它 是 ISO 制定 的 二 维 
图 形 库 的 国际 标准 。 
GKS 通过 “segment” 
采用 了 显示 列表 模型 。 
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* 这 也 是 一 种 设计 模式 。 


那么 ， 对 于 C 语言 ， 最 终 的 方案 是 什么 ? 将 数据 和 处 理 过 程 分 开 是 一 
个 好 的 解决 方案 。 问 题 是 ， 为 了 区 分 图 形 种 类 而 产生 的 switch case。 比 
起 数据 的 生命 周期 ,试图 废弃 一 部 分 程序 逻辑 时 ,也 不 是 只 能 使 用 switch 
case。 除 此 之 外 , 还 可 以 考虑 使 用 Vistor 模式 ,在 Vistor 模式 中 , Polyline 
和 Rectangle 并 存 于 Vistor 一 侧 ， 所 以 这 种 手法 和 switch case 相 比 好 像 
换 汤 不 换 药 。 或 者 在 所 有 的 Shape 中 ， 只 定义 将 “形状 ”变换 成 折线 的 方 
法 ,而 将 draw() 方 法 放 到 类 的 外 面 ; 抑或 ,在 Shape 中 只 保留 一 个 指向 “ 定 
义 了 运行 时 执行 逻辑 的 对 象 ” 的 指针 ,然后 在 从 文件 中 加 载 Shape 实例 时 ， 
通过 Abstract Factory 模式 实例 化 出 特定 的 运行 时 对 象 …… 

唉 ， 总 是 有 无 尽 的 烦恼 纠缠 在 程序 设计 者 周围 。 


5.2.7 ”对 指针 的 恐惧 
大 多 的 绘图 工具 ， 都 有 图 形 “ 复 制 ” 功 能 。 比 如 ， 如 果 是 Windows 上 的 
工具 ， 通 过 选择 图 形 一 复制 一 粘贴 ， 就 可 以 完成 图 形 的 复制 。 


/* 将 指向 被 复制 图 形 的 指针 放 在 new_shape 中 */ 
Shape *new_shape; 


























new_shape = malloc(sizeof(Shape)); 
xnew_shape = *shape; 一 一 通过 结构 体 赋值 将 Shape 结构 体 赋予 new_shape 


/* 将 new_shape 连接 到 链表 的 末尾 */ 

同学 ， 你 知道 上 面 的 代码 中 ， 哪 里 有 问题 吗 ? 

如 果 被 复制 的 图 形 是 长 方形 或 者 到 ， 上 面 的 方法 是 没有 缺陷 的 。 可 是 ， 
一 旦 使 用 上 面 的 方法 对 折线 进行 复制 ， 会 怎样 呢 ? 

Polyline 中 只 是 持 有 指向 它 的 坐标 群 ( Point 的 可 变 长 数组 ) 的 指针 ， 
坐标 群 自身 其 实 是 保存 在 其 他 的 内 存 区 域 中 的 。 因 此 ， 即 使 通过 结构 体 一 次 
赋值 的 方式 对 Shape 进行 复制 ， 坐 标 群 自身 却 并 没有 被 复制 。 结 果 就 是 ， 多 
个 Shape 共享 了 同一 个 坐标 群 。 


这 种 状态 显然 不 是 我 们 原本 期 待 的 结果 。 只 要 变化 了 一 个 折线 的 坐标 ， 
其 他 折线 的 坐标 也 会 跟着 一 起 变化 。 还 有 ， 在 删除 某 折线 时 使 用 了 freeGO) 释 
放 坐 标 群 的 内 存 区 域 ， 就 会 发 生 重大 的 问题 。 其 中 的 缘由 已 经 在 2.6.4 节 中 向 
大 家 说 明 过 了 。 

就 像 这 样 ， 如 果 指 针 指 向 了 一 个 偏离 程序 员 意 图 的 对 象 ， 调 试 是 异常 困 
难 的 。 上 面 的 折线 的 例子 还 算 比 较 简 单 ， 一 旦 图 形 中 更 加 复杂 的 数据 结构 的 
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昌 针 纠结 到 一 起 ， 结 局 往往 惨不忍睹 。 


Shape 


Point 的 数组 


EE 


图 5-17 多 个 Shape 共享 一 个 坐标 群 
人 们 有 时 说 :“ 指 针 很 可 怕 。 ”他们 大 多 是 想 表达 下 面 的 意思 吧 ， 


C 语 言 的 指针 一 旦 指向 一 个 奇怪 的 地 址 ,程序 往往 会 在 一 个 不 起 
眼 的 地 方 前 江 。 


其 实 ， 我 认为 真正 的 可 怕 之 处 在 于 : 





























因为 引用 关系 的 相互 纠葛 而 导致 程序 调试 非常 困难 。 
前 者 的 恐惧 是 C 语言 的 特性 带 来 的 ， 而 后 者 的 恐惧 ， 伴 随 着 所 有 的 持 有 
§ 针 的 语言 "。 
随便 提 一 下 ，Pascal 的 作者 Niklaus Wirth 认为 ,数据 结构 中 的 指针 对 应 于 


用 于 逻辑 跳 转 的 goto (《 算 法 + 数据 结构 = 程序 》[] p.192 ) "。 确 实 ， 对 此 我 
也 深 有 同感 , 但 至 少 在 目前 ,不 使 用 指针 ,还 是 无 法 构造 出 复杂 的 数据 结构 。 











5.2.8 ”说 到 底 ， 指 针 究 葛 是 什么 
本 章 从 “数据 结构 ”这 个 侧面 ， 对 指针 进行 了 说 明 。 





在 单 向 链表 、 双 向 链表 、 树 、 哈 希 〈 链 式 ) 的 图 解 中 ,“ 箭 头 ”必然 会 登 
场 。 这 个 “箭头 ”， 就 是 指针 。 


在 设计 数据 结构 的 时 候 ， 如 果 不 使 用 “箭头 ”， 就 很 难 设 计 出 “像样 的 ” 



































Q@ goto 是 目前 很 多 编程 规范 中 提倡 尽量 避免 使 用 的 逻辑 跳 转 方式 。 在 此 ，Niklaus Wirth 的 意 
思 是 指针 和 goto 一 样 ， 应 该 尽量 避免 使 用 。 译 者 注 
































x* 有 GC (Garbage Colle- 


ction ) 功能 的 语言 , 也 
只 能 回避 free() 的 相 
关 问 题 。 


正如 一 度 提 倡 使 用 if、 
for、while 这 样 的 控 
制 结构 来 取缔 goto 一 
样 , 如 果 普 及 使 用 集合 
类 库 , 程序 员 不 用 顾及 
指针 , 也 可 以 轻松 操作 
和 象 链表 这 样 频繁 使 用 
数据 结构 。 尽 管 如 
此 ,我 并 不 认为 完全 不 
使 用 指针 的 情况 下 , 能 
解决 所 有 的 问题 。 
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数据 结构 。 因 此 ,“ 指 针 ” 是 构造 “像样 的 ”数据 结构 时 必需 的 概念 , 如今 “ 像 
样 的 ”程序 都 会 使 用 指针 。 

如 果 要 说 起 C 语言 指针 特有 的 功能 ， 那 就 不 得 不 提 到 它 和 数组 之 间 微 妙 
的 可 交换 性 。 关 于 这 一 点 ， 在 第 4 章 进 行 了 完整 的 说 明 。 

对 于 C 语 言 ， 我 们 经 常 听 到 下 面 的 观点 : 

C 语 言 和 硬件 关系 密切 ， 为 什么 这 么 说 ， 因 为 C 语 言 中 有 指针 。 

对 于 早期 的 编程 ， 或 者 现在 有 时 也 能 见 到 的 操作 系统 内 核 编 程 ， 也 许可 
以 认为 指针 和 硬件 关系 密切 。 

但 只 要 你 能 很 好 地 理解 第 4 章 的 那些 常用 用 法 ,还 有 第 5 章 中 介绍 的 将 指 
针 作为 箭头 来 使 用 的 方法 ， 仅 仅 是 使 用 C 语言 来 开发 应 用 程序 应 该 是 游 刀 有 
余 了 。 

我 想 ,“ 将 指针 作为 箭头 来 使 用 ”这 个 “真正 的 指针 的 使 用 方法 ”， 对 于 
其 他 语言 也 同样 适用 。 
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下 
其 他 一 一 拾 遂 


6.1 陷阱 


6.1.1 关于 strncpy( ) 
C 语言 使 用 空 字符 来 结束 字符 串 。 


printf() 和 strcpyQ) 都 把 这 一 点 作为 默认 的 前 提 条 件 。 此 外 , 编译 器 也 
会 在 字符 串 常 量 的 末尾 自动 加 上 空 字符 。 


可 是 ，strncpy() 却 令 人 迷惑 地 打破 了 这 个 规则 。 


strncpyQ 〇 像 strncpy(dest，src，1en) ;这 样 使 用 ， 从 src 复制 最 大 
长 度 为 1en 的 字符 到 dest 中 。 当 src 的 长 度 大 于 len 时 ，dest 不 会 以 空 字 ”x* 反 过 来 ， 如 果 src 比 
符 结 束 `。 len 短 , 就 会 使 用 空 字 
符 补 足 剩余 的 长 度 。 
因此 , 冒 冒 失 失 地 使 用 了 strncpyQ ,之 后 再 使 用 printf()、sprintfO、 这 个 规则 也 是 有 点 奇 
strcpy 0 等 处 理 dest, 由 于 其 末尾 可 能 没有 空 字符 , 进而 可 能 会 发 生 处 理 越 怪 的 。 
界 ， 以 至 于 破坏 大 片 内 存 区 域 的 数据 。 因 此 ，strncpy() 是 危险 的 。 


要 点 
如 果 使 用 strncpy() ， 请 注意 它 可 能 会 产生 没有 空 字符 结尾 的 字符 串 。 
















































































但 也 有 完全 相反 的 观点 : 
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对 于 strcpy()， 在 src 过 长 的 情况 下 ， 很 容易 破坏 内 存 区 域 。 
而 strncpy() 可 以 通过 指定 1en 来 阻止 内 存 的 被 破坏 。 所 以 ， 
strncpy() 更 安全 。 




















可 是 ， 即 使 是 通过 对 len 的 设 定 “ 当 场 ”阻止 了 内 存 破 坏 的 发 生 ， 但 作 
为 结果 ， 还 是 会 产生 没有 空 字符 结尾 的 奇怪 的 字符 串 ， 依 然 会 发 生 由 于 使 用 
sprintf(0) 而 导致 的 内 存 破 坏 。 倒 不 如 说 ,“bug 最 终 爆 发 的 现场 远离 制造 bug 
的 地 方 ” 这 种 结果 ， 在 性 质 上 更 为 恶劣 。 






































对 于 “只 是 复制 len 长 度 的 字符 ， 即 使 之 后 的 字符 被 切 掉 也 没 问题 ”这 种 
需求 ， 是 不 是 应 该 考虑 写 一 个 1.2.5 节 补 充 内 容 中 介绍 的 my_strncpy() 这 样 
的 函数 呢 ? 依 我 之 见 ，strncpyO) 应 该 用 来 实现 my_strncpyQ 〇 这 样 的 函数 ， 
或 者 用 于 对 大 型 机 中 常见 的 定 长 字段 的 操作 。 








下 面 我 也 来 扯 个 闲 篇 儿 ， 茶 日 某 地 点 ， 我 听 到 两 个 人 的 对 话 : 


有 个 哥们 儿 写 了 这 么 一 行 代码 ， 
strncpy(dest, src, strlen(src) + 1); 


“这 ， 这 是 啥 啊 ， 明 明 可 以 用 strcpyO” 


Hy 








6.1.2 ”如 果 在 早期 的 C 中 使 用 float 类 型 的 参数 


如 今 已 经 很 少 有 人 使 用 ANSIC 以 前 的 C 了 , 但 我 认为 还 是 不 能 绕 过 “里 
期 的 C” 来 理解 函数 参数 的 类 型 。 



































函数 的 原型 声明 是 从 ANSIC 以 后 开始 导入 的 ， 之 前 的 C 中 ， 郴 数 的 声 
明 像 


double sinQO; 





这 样 只 能 指定 返回 值 ， 而 不 能 指定 参数 。 


其 实 , 上 面 的 三 角 函 数 sin() 的 参数 应 该 是 double。 那么 , 在 调用 sinO) 
的 时 候 ， 如 果 传 人 float， 会 导致 什么 样 的 结果 呢 ? 








在 ANSIC 的 mathh 中 ，sin() 声 明 如 下 : 


double sin(double x); 
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因此 , 即使 向 形 参 中 传递 float 类 型 , 编译 带 也 会 自动 将 其 转换 成 double 类 型 。 


那么 ， 对 于 ANSI C 以 前 的 C， 究 竟 会 发 生 什 么 呢 ? 答案 就 是 一 一 float 
类 型 的 参数 还 是 会 被 转换 成 double。 


ANSI C 以 前 的 C， 会 将 表达 式 中 的 float 类 型 依次 转换 成 double。 假 
设 ， 我 们 需要 做 一 次 float 类 型 的 加 法 运算 ， 然 后 将 结果 保存 在 float 类 型 
中 ， 其 内 部 过 程 如 下 ， 


@ 将 两 边 的 变量 转换 成 double 
@ 进行 double 类 型 的 加 法 运算 
@ 将 结果 变换 成 float 类 型 


因此 ， 与 直接 使 用 double 类 型 相 比 ， 肯 定 是 float 类 型 的 加 法 运算 速 
度 比较 慢 , 于 是 在 不 知 不 觉 中 流传 起 来 “不 要 使 用 float 类 型 ”这 样 的 说 法 。 


对 于 函数 的 参数 会 发 生 同 样 的 问题 。 所 以 在 使 用 sinQ) 的 时 候 ， 应 该 没 
有 必要 去 分 辨 参数 是 float 还 是 double。 这样 看 上 去 挺 方便 , 但 对 于 本 来 就 
是 “将 float 作为 参数 的 函数 "， 又 会 发 生 什 么 问题 呢 ? 


在 我 现在 使 用 的 编译 器 (gcc ) 中 ， 可 以 通过 开关 选项 ( -traditional ) 
让 编译 器 按照 ANSI C 以 前 的 C 进行 处 理 。 此 外 ， 还 可 以 通过 -S 选项 输出 汇编 
代码 。 通 过 这 两 个 选项 ， 尝 试 编译 下 面 的 两 段 代 码 (参照 代码 清单 6-1 和 代码 
清单 6-2 )。 


















































































































































代码 清单 6-1 float.c 





sub_func(&f); 





1: void sub_funcO); 
2: 

3: void func(f) 

4: float fs 

5 计 

6: 

pA 





} 





代码 清单 6-2 double.c 





1: void sub_funcO); 
2 

3: void func(d) 

4: double dd; 

5s. ,uf 

6: 

Ye 


sub_func(&d); 








} 





* 当然 ,在 构造 较 大 的 数 
组 的 时 候 , 大 部 分 的 情 
况 下 还 是 使 用 float 
比较 节约 内 存 。 
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兴 如 果 再 说 明 得 细致 一 
些 ， 其 实 作为 辅助 信 
息 的 文件 的 名 称 是 不 
同 的 。 














对 输出 的 汇编 代码 进行 比较 后 , 得 到 了 完全 相同 的 输出 结果 .也 就 是 说 ， 
在 形 参 类 型 为 float 的 情况 下 , ANSIC 以 前 的 C 的 编译 器 会 一 声 不 咏 地 将 参 
数 解释 成 double( 挺 可 气 的 )。 


而 且 在 上 面 的 例子 中 , 向 sub_funcG) 中 传递 的 是 指向 形 参 的 指针 。 对 于 
代码 清单 6-1 的 sub_funcQ 〇 来 说 ， 肯 定 应 该 接受 “指向 float” 的 指针 吧 。 
但 是 ，f 却 被 擅自 地 解释 成 了 double， 这 种 传递 结果 自然 是 不 正确 的 。 


顺便 说 一 下 ， 对 于 整 型 也 会 发 生 同 样 的 事情 。 在 C 中 ， 比 int 小 的 整 型 
如 果 出 现在 表达 式 中 ， 同 样 会 被 依次 地 转换 成 int。 但 是 ， 在 整形 的 情况 下 ， 
一 旦 参数 被 作为 int 接受 , 就 会 缩小 为 原来 的 类 型 , 所 以 不 会 发 生 上 面 的 问题 。 


/* 

* 对 于 void func(Cshort s) 这 个 函数 定义 ， 

* 编译 器 会 生成 和 下 面 的 C 语 言 代 码 等 同 的 机 器 代码 
%/ 

void func(int s_temp) 


{ 
































short s = s_temp; 


} 

请 大 致 浏览 一 下 标准 库 函 数 。 在 math.h 数学 运算 库 中 ， 清 一 色 地 都 使 用 

了 double。 在 stdio.h 和 ctype.h 中， 有 很 多 操作 字符 的 函数 (如 putchar@ ) 

的 参数 也 声明 成 了 int。 
ANSIC 以 前 的 C 原本 不 能 传递 float 类 型 , 虽然 针对 char 和 short 做 

了 补救 措施 ,但 由 于 加 入 了 多 余 的 处 理 而 导致 了 执行 效率 低下 。 


至 少 对 于 ANSIC 以 前 的 C 来 说 ， 遇 到 整 型 基本 作为 int， 遇 到 浮 点 ; 
本 作为 double 来 考虑 。 























7 


EE 


其 


6.1.3 printf() 和 scanf() 


对 于 ANSI C 以 前 的 C， 比 int 小 的 类 型 会 被 依次 地 转换 成 int，float 
会 被 依次 地 转换 成 doub1e, 所 以 不 会 出 现 接 受 float 类 型 参数 的 函数 ; 针对 
char 和 short， 编 译 器 通过 别 的 方式 做 了 补救 措施 。 


因为 ANSIC 有 原型 声明 , 所 以 无 论 是 char 还 是 float, 都 可 以 直接 传递 。 
可 是 ,对 于 printfGO) 这 样 的 具有 可 变 长 参数 的 函数 ， 原 型 声明 对 可 变 长 
































根据 不 同 的 环境 ， 输 出 结果 可 能 会 有 一 些 差异 。 一 一 译 者 注 
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部 分 的 参数 是 不 产生 任何 影响 的 。 因 此 ， 这 部 分 的 参数 同样 会 被 编译 器 进行 
类 型 转换 操作 。 也 就 是 说 ， 比 int 小 的 类 型 会 被 转换 成 int，float 会 被 升 
级 成 double。 

















结果 就 是 ， 不 能 向 printfQ 〇 传递 char 类 型 和 float 类 型 。 


哈 ? 对 于 printf()， 不 是 有 %f 用 于 表示 float，%1f 用 于 表示 
double 吗 ? 


其 实 ， 这 不 能 不 说 是 个 误解 ( 锅 怕 是 来 源 于 scanf0) 的 转换 修饰 符 )。 对 
于 printf(), float 和 double 共用 了 %f。 在 printfQ) 中 使 用 %1f， 其实 这 
种 行为 根本 没有 在 规范 中 定义 ( 如 果 提 高 gcc 的 警告 级 别 ， 编 译 器 会 对 %1f 
的 使 用 提出 警告 )。 

同样 ，char 和 short 也 可 以 用 %d 来 表示 。 

反 过 来 ， 在 带 有 可 变 长 参数 的 函数 一 侧 ， 

va_arg(ap, char) 

va_arg(ap, short) 

va_arg(ap, float) 

这 样 的 写法 也 是 经 常 发 生 的 错误 。 

此 外 ，scanfQ) 使 用 了 和 printf() 非 常 相似 的 转换 修饰 符 。 对 于 那些 在 
使 用 printf() 时 已 经 习惯 将 float 和 double 都 用 %f 表示 的 程序 员 ， 对 
scanf() 往 往 有 着 同样 的 期 待 。 


可 是 ， 因 为 向 scanfQ 〇 传递 的 是 指针 ， 所 以 并 没有 放 入 类 型 信息 。 因 此 ， 
如 果 想 在 scanf() 中 使 用 double， 必 须 指定 %1f。 



























































6.1.4 ”原型 声明 的 光 和 影 


最 近 ，ANSIC 以 前 的 C 确实 已 经 开始 慢 慢 绝迹 了 。 以 前 经 常会 发 生 “ 将 
老 的 C 转换 成 ANSIC” 的 工作 2 。 


ANSIC 是 像 下 面 这 样 进行 函数 定义 的 : 

















int funcCint hoge, int piyo) 




















GD 看 到 这 里 ， 干 对 日 软件 外 包 的 同学 笑 了 。 对 日 软件 外 包 中 , 这 种 活 是 特别 多 的 ,一 般 把 这 
种 活 叫做 “移行 "。 一 一 译 者 注 
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# 几乎 所 有 的 处 理 环 境 
都 是 这 样 的 。 对 于 调用 
没有 原型 定义 的 函数 ， 
规范 完全 没有 规定 究 
竞 应 该 怎么 做 。 


} 
ANSIC 以 前 的 C， 却 是 写成 下 面 这 样 : 





int func(hoge, piyo) 
int hoge; 
int piyo; 


} 


为 ANSI 同时 也 允许 老 的 写法 , 所 以 即使 不 修改 成 新 的 写法 , 也 能 通过 
编译 。 但是， 从 ANSIC 开始 导入 的 函数 原型 声明 ， 对 发 现 程序 员 的 编程 错误 
是 非常 有 益 的 。 所 以 ， 建 议 大 家 尽量 使 用 新 的 函数 定义 方法 。 


将 老 的 函数 定义 一 个 一 个 改过 来 ， 的 确 是 一 件 比较 繁琐 的 事 。 


























那 就 不 要 去 修改 函数 定义 本 身 ， 只 要 在 头 文件 中 加 上 原型 声明 
不 就 完事 儿 了 嘛 ! 


应 该 有 人 是 这 样 想 的 吧 ? 我 也 这 么 想 过 。 
但 是 ， 请 你 再 回想 一 下 之 前 说 明 过 的 内 容 。 


在 没有 函数 原型 声明 的 情况 下 ， 比 int 小 的 参数 的 类 型 会 被 依次 地 转换 
成 int， 而 float 类 型 的 参数 会 被 依次 地 转换 成 double [这 种 转换 称 为 默认 实 
参 提升 ( default argument promotion ) ]。 因 此 ， 在 接受 参数 的 一 侧 生成 的 代码 
总 是 处 理 “ 转 换 后 的 相对 较 大 的 数据 类 型 ”。 


反 过 来 ， 在 提供 函数 原型 声明 的 情况 下 ， 因 为 参数 以 原来 的 类 型 传递 ， 
所 以 在 接受 参数 的 一 侧 ， 总 是 生成 针对 原来 的 数据 类 型 的 机 器 代码 。 


可 是 ， 函 数 的 定义 和 函数 的 调用 可 能 存在 于 完全 不 同 的 编译 单元 中 。 那 
么 ， 在 编译 函数 定义 的 时 候 ， 编 译 需 究竟 根据 什么 来 判断 应 该 生成 哪 种 机 器 
代码 呢 ? 一 一 根据 函数 的 定义 的 新 旧 形式 。 

对 于 旧 的 函数 定义 ,一 旦 调用 提供 原型 声明 的 函数 ， 在 函数 定义 的 一 侧 
期 待 的 就 是 经 过 “默认 实 参 扩展 ”后 的 数据 类 型 ， 但 实际 中 如 果 传 递 没 有 经 
过 扩展 的 数据 类 型 ， 就 可 能 会 发 生 问题 。 


为 了 防 患 于 未 然 , 应 该 在 定义 函数 的 文件 中 多 nclude 声明 函数 自身 原型 
的 头 文件 。 如 果 这 人 么 做 了 ， 但 凡是 正经 的 编译 器 ， 都 会 给 出 原型 和 函数 定义 























































































































6.2 惯用 句法 245 








不 一 致 这 样 的 警告 。 无 论 在 什么 情况 下 ， 只 要 想 让 编译 髓 帮 我 们 找 出 函数 原 
型 和 函数 定义 不 一 致 的 地 方 , 就 必须 在 函数 定义 的 代码 中 ##nclude 函数 原型 。 
如 果 原 型 和 函数 定义 不 一 致 , 那么 好 不 容易 在 ANSIC 中 引入 的 机 制 简 直 就 成 
了 摆设 了 ( 甚至 可 以 说 是 有 害 的 )。 


要 点 
在 函数 定义 的 代码 文件 中 , 必须 #include 包含 此 函数 自身 原型 声明 的 头 文 
件 。 


一 旦 决定 了 使 用 原型 声明 , 调用 该 函数 所 有 代码 文件 也 必须 #include 包 
含 原型 声明 的 头 文件 。 但 人 总 是 会 犯错 误 的 ， 所 以 还 是 建议 提高 编译 器 的 警 
告 级 别 ， 一 旦 调用 没有 原型 声明 的 函数 就 让 编译 需 向 我 们 给 出 警告 。 

此 外 ， 为 了 提高 执行 速度 ， 有 些 编译 器 往往 不 使 用 栈 ， 而 是 使 用 寄存 器 
来 传递 参数 。 但 对 于 可 变 长 参数 的 函数 ， 这 些 编译 器 还 是 使 用 了 栈 来 传递 参 
数 ， 但 至 于 “是 不 是 可 变 长 参数 的 函数 ”， 调 用 方 在 原型 声明 以 外 的 地 方 是 无 
法 判断 的 。 因 此 ,在 这 样 的 处 理 环境 中 ， 如 果 不 #include stdioh，printfO) 
是 不 能 顺利 执行 的 。 


要 点 
如 果 调 用 提供 了 原型 声明 的 函数 ， 就 必须 #inc1lude 原型 声明 。 


6.2 ”惯用 句法 


6.2.1 结构 体 声明 


对 于 这 种 习惯 用 法 ， 可 能 会 有 不 同 的 观点 。 但 是 我 在 声明 结构 体 的 时 候 ， 
必定 会 同时 给 出 typedef 定义 。 


























































































































typedef struct { 
int a; 
int b; 

} Hoge; 


此 外 ， 在 没有 特别 需要 的 情况 下 ， 我 一 般 不 写 tag 。 在 需要 写 tag 的 时 
候 ， 一 般 像 下面 这 样 ， 在 定义 的 类 型 名 称 后 面 追 加 _tag。 
typedef struct Hoge_tag { 
int a; 


int b; 
} Hoge; 








水 


党 


实际 上 ,以 前 也 曾经 过 
到 过 对 函数 定义 和 原 
型 之 间 的 参数 一 致 性 
不 做 检查 的 编译 器 。 


这 是 由 于 ,在 特别 需要 
的 情况 下 写 tag，tag 
的 存在 表明 了 “正在 被 
前 方 引 用 ”这 层 意思 。 
也 有 人 主张 “因为 不 
知道 什么 时 候 需要 ， 
所 以 必须 写 tag” 这 样 
向 观点。 
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还 有 ， 对 于 结构 体 、 共 用 体 、 枚 举 的 tag 名 ， 因 为 持 有 和 一 般 的 标识 符 
不 同 的 命名 空间 ， 所 以 它们 也 可 以 写成 下 面 这 样 : 
typedef struct Hoge { 
int a; 
int b; 
} Hoge; 


因为 写成 这 样 则 与 C++ 意思 相同 ， 所 以 也 有 很 多 人 喜欢 这 种 写法 。 


在 声明 结构 体 的 时 候 ， 虽 然 可 以 同时 定义 这 个 结构 体 类 型 的 变量 ， 但 我 
不 会 这 么 做 。 一 想到 typedef， 就 完全 没有 了 这 么 写 的 冲动 ， 因 为 类 型 的 声 
明和 变量 的 定义 根本 就 是 不 同 的 概念 ， 所 以 我 认为 还 是 分 开 书写 比较 好 。 

/* 我 不 会 这 样 写 */ 

struct Hoge_tag { 

int a; 
int b; 

} hoge; < 一 上 声明 Struct Hoge_tag 类 型 的 变量 

随便 再 提 一 下 ， 虽 然 声 明 结 构 体 的 成 员 时 ， 可 以 和 声明 一 般 的 变量 一 样 ， 
一 次 性 声明 多 个 变量 ,但 是 我 不 会 这 么 做 。 

/* 我 不 会 这 样 写 */ 

typedef struct { 


int a, b; 
} Hoge; 


6.2.2 自 引 用 型 结构 体 
为 了 构造 链表 和 树 ， 我 们 会 声明 包含 指向 相同 类 型 的 指针 的 结构 体 。 


这 样 的 结构 体 ， 好 像 一 般 都 称 为 “ 自 引 用 型 结构 体 ” 一 一 为 什么 是 “好 
像 ”?C 语 言 的 入 门 书籍 中 倒是 这 么 称呼 的 , 但 是 在 开发 现场 ,我 从 没 听 到 过 
有 人 使 用 这 个 称呼 。 称 之 为 “ 自 引用 型 结构 体 "， 其 实 没有 任何 特殊 的 理由 。 


但 是 ， 对 于 这 种 结构 体 的 声明 ， 还 是 有 必须 要 留意 的 地 方 。 

























































































typedef struct Hoge_tag { 


int ai 

int b; 

struct Hoge_tag *next; 
} Hoge; 


在 这 种 情况 下 ， 在 声明 成 员 next 的 时 候 ，typedef 还 没有 结束 ， 类 型 
Hoge 还 不 能 被 使 用 ， 所 以 next 还 只 能 声明 成 struct Hoge_tag*。 
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或 者 也 可 以 写成 下 面 这 样 : 
typedef struct Hoge_tag Hoge; 


struct Hoge_tag { 


int ai 
int b; 
Hoge *Nnext; 


$s 


6.2.3 ”结构 体 的 相互 引用 


在 3.2.10 节 中 我 们 说 过 ， 对 于 相互 引用 的 结构 体 ， 应 该 像 下 面 这 样 只 是 
将 tag 提前 声明 : 








在 下 面 的 代码 中 ,Man 持 有 指向 “ 妻 ” 的 指针 ，Woman 持 有 指向 “ 夫 ” 的 
指针 。 


typedef struct Woman_tag Woman; 一 一 提前 对 tag 进行 类 型 定义 
typedef struct { 
Woman x*wife; /* 妻 */ 
} Man; 
struct Woman_tag { 
Man x*husband; /* 夫 */ 
}; 
以 前 , 一 提出 上 面 这 种 写法 ， 肯 定 就 有 人 这 么 想 : 


哇 嘎 嘎 ， 那 就 把 所 有 的 tag 全 部 提前 声明 ， 然 后 就 可 以 按照 任意 的 顺序 
声明 结构 体 了 。 


于 是 ， 就 有 了 下 面 这 样 的 代码 ， 


typedef struct Polyline_tag Polyline; 
typedef struct Shape_tag Shape; 将 所 有 tag 提前 声明 

















struct Shape_tag { 
ShapeType type ; 
union { 


Polyline polyline; 一 一 只 声明 了 tag, 使 用 了 Polyline 的 实体 ! 
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Rectangle rectangle; 
Circle circle; 
和 
3 


struct Polyline_tag { 


二 

上 面 的 代码 是 无 法 通过 编译 的 。 

在 只 是 声明 tag 的 情况 下 ， 其 类 型 是 “不 完全 类 型 ”。 对 于 不 完全 类 型 ， 
只 能 取得 其 指针 (参照 3.2.10 节 )。 


因为 还 不 知道 不 完全 类 型 的 长 度 ， 所 以 编译 器 无 法 确定 结构 体 成 员 的 偏 
移 量 。 












































= 





6.2.4 ”结构 体 的 腐 套 


将 结构 体 作为 另 一 个 结构 体 的 成 员 时 ， 可 以 像 下 面 这 样 使 用 已 经 声明 的 
结构 体 : 
typedef struct { 
int a; 
int b; 





} Hoge; 


typedef struct { 


Hoge hoge; 一 一 将 结构 体 Hoge 放 到 Piyo 的 成 员 中 
} Piyo; 


也 可 以 声明 另 一 个 结构 体 类 型 ， 并 且 同 时 将 其 声明 为 成 员 : 


typedef struct { 
struct Hoge_tag { 
int a; 
int b; 
} hoge:; 
} Piyo; 


此 处 声明 的 struct Hoge_tag 在 之 后 还 是 可 以 使 用 的 。 但 是 ， 因 为 可 以 
省 略 tag， 所 以 也 可 以 写成 : 
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typedef struct { 
struct { 
int a; 
int b; 
} hoge; 
} Piyo; 


但 这 种 情况 下 ， 之 后 就 不 能 重复 使 用 相同 的 类 型 了 。 



































我 一 般 不 在 结构 体 声明 中 再 声明 结构 体 ， 倒 是 经 常 在 结构 体 中 声明 共用 


体 。 这 个 在 后 一 小 节 中 说 明 。 


6.2.5 ”共用 体 


共用 体 几 乎 总 是 和 结构 体 、 枚 举 组 合 使 用 。 
在 第 5 章 我 们 定义 了 下 面 这 样 的 Shape 类 型 ， 


typedef enum { 
POLYLINE_SHAPE ， 
RECTANGLE_SHAPE, 
CIRCLE_SHAPE 

} ShapeType ; 


typedef struct Shape_tag { 
ShapeType type ; 


union { 
Polyline polyline; 
Rectangle rectangle; 
Circle circle; 
ui 
} Shape; 





Shape 可 能 是 Polyline (多 点 折线 )， 也 可 能 是 Rectangle (长 方形 ) 
或 者 是 Circle ( 圆 )。 此 时 ， 我 们 可 以 用 共用 体 。 








为 了 表示 共用 体 “ 此 时 真正 使 用 的 成 员 是 哪 一 个 ”， 使 用 了 枚 举 型 


ShapeType 的 变量 type。 程序 员 有 责任 确保 枚 举 的 标识 和 真正 被 存储 的 成 员 
之 间 的 整合 性 。 











在 某 些 书籍 当中 也 会 出 现下 面 的 共用 体 用 法 : 


typedef union { 
char c[4]; 
int int_value; 
} Int32; 


在 int 为 4 个 字 节 的 情况 下 ， 可 以 以 C 中 规定 的 字 节 为 单位 来 访问 
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int_value 中 保存 的 整数 值 。 
可 是 ， 其 结果 完全 依赖 于 环境 的 字 节 排序 (参照 2.8 节 )， 并 且 规 范本 来 
也 没有 规定 int 就 是 32 位 。 


我 并 没有 偏执 地 认为 这 种 写法 是 完全 错误 的 ， 但 是 在 使 用 这 种 技巧 的 同 
时 ， 的 确 应 该 意识 到 程序 的 可 移植 性 问题 。 






































6.2.6 ”数组 的 初始 化 

一 维 数组 可 以 通过 下 面 的 方式 进行 初始 化 : 

int hoge[] = {1, 2, 3, 4, 5}; 

因为 编译 需 会 去 计算 数组 元 素 的 个 数 ， 所 以 此 时 没有 必要 特别 地 去 定义 
元 素 个 数 。 为 了 防止 出 现 不 必要 的 错误 ， 也 最 好 不 要 在 此 处 定义 元 素 个 数 。 

二 维 以 上 的 数组 ， 可 以 像 下 面 这 样 初始 化 : 

int hoge[][3] = { 

{1，2，3},， 


{4， 5 6}, 
{7,， 8， 9}, 
































}; 
除了 “最 外 层 ” 的 数组 ”, 其 他 层 包 含 的 数组 是 不 能 省 略 元 素 个 数 定义 的 。 
请 参照 3.5.2 节 。 





6.2.7 char 数组 的 初始 化 
char 数组 可 以 通过 下 面 的 方式 进行 特殊 的 初始 化 : 


char str[] = "abc"; 























char str[] = {'a'’, 'b', 'c', '\0'}; 
的 语法 糖 。 

因为 末尾 加 上 了 '\0'， 所 以 str 的 元 素 个 数 为 4。 

此 时 ， 多 余地 加 上 元 素 个 数 的 定义 ,很 可 能 会 发 生 下 面 的 错误 : 




















(多 维 数组 的 “最 外 层 ” 是 指 将 其 他 数组 作为 元 素 进 行 包含 的 最 外 侧 的 数组 。 一 一 译 者 注 
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char str[3] = "abc"; 一 一 忘记 了 '\0' 的 存在 
为 了 避免 这 样 的 错误 ， 应 该 省 略 元 素 个 数 的 定义 ， 把 对 元 素 计 数 的 工作 交 给 
编译 器 来 做 。 
话说 回来 , 其 实在 实际 编程 中 , 使 用 字符 串 初 始 化 的 char 的 数组 的 情况 
并 不 多 ,一般 写 成 下 面 这 样 就 足够 了 : 

char x*str = "abc"; 

两 者 的 不 同 在 于 : 相对 于 前 者 初始 化 “char 的 数组 ”的 内 容 ， 后 者 是 利 
用 字符 串 常量 初始 化 “指向 char 的 指针 ”。 字 符 串 常量 一 般 保 存在 只 读 的 内 
存 区 域 (参照 第 2 章 )， 所 以 后 者 不 能 修改 字符 串 的 内 容 ”。 





















































6.2.8 ”指向 char 的 指针 的 数组 的 初始 化 


在 需要 几 个 字符 串 组 成 的 数组 时 ,一般 我 们 使 用 "指向 char 的 指针 的 数组 ”。 


char *Ccolor_name[] = { 
"red", 
"green", 
"blue", 


和 
最 后 的 blue 后 面 加 了 一 个 逗号 ， 这 并 不 是 一 个 错误 。 


C 语言 中 , 在 数组 的 初始 化 表达 式 最 后 的 元 素 后 面 , 既 可 以 加 有 逗号, 也 可 
以 不 加 。 


很 多 人 讨 大 这 个 规则 ， 我 倒是 很 喜欢 。 其 实在 所 有 的 元 素 后 面 都 添加 去 
， 还 是 挺 方 便 的 。 对 于 字符 串 的 情况 ， 倘 若 在 最 后 一 个 元 素 后 面 不 追加 去 
， 当 增加 一 个 元 素 的 时 候 ， 容 易 糊 里 糊涂 地 写成 下 面 这 样 ， 
char x*color_name[] = { 
"red", 
"green", 
"blue” 一 一 忘 了 加 过 号 
"yellow" 


} 
此 时 ，ANSIC 会 擅自 将 相 邻 的 字符 串 常 量 连接 起 来 ， 上 面 的 数组 就 变 成 
了 “red”、“green”、“blueye1low” 构 成 的 只 有 3 个 元 素 的 数组 ”。 


Rationale 中 “数组 的 初始 化 表达 式 最 后 的 元 素 后 面 ， 可 以 加 逗号 ， 也 可 
以 不 加 逗号 ”这 样 的 规则 ， 除 了 使 追加 /删除 元 素 更 为 方便 之 外 ， 还 有 一 个 原 




















du 




















# 在 有 些 环境 中 ,也 许 是 
可 以 修改 的 。 这 一 点 毕 
竞 还 是 要 依赖 于 环境 。 


* 很 明显 ,这 个 问题 的 起 
因 是 “擅自 地 连接 了 相 
邻 的 字符 串 ”。 作 为 连 
接 字符 串 的 功能 ,这 好 
像 还 挺 好 使 的 。 不 过 倒 
不 如 像 Perl 那样 ， 在 
字符 串 之 间 放 入 “.” 
来 连接 字符 串 , 就 不 会 
发 生 这 样 的 问题 了 。 
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# 根据 编译 器 的 不 同 , 有 
的 编译 器 可 能 会 忽略 
这 种 问题 , 有 的 编译 器 
会 报 出 警告 。 




















因 就 是 ， 能 够 更 简单 地 开发 自动 生成 代码 的 程序 (参见 Ratinale 的 3.3.7”)。 
但 是 ， 枚 举 的 声明 中 却 没有 这 样 的 规则 ， 所 以 我 认为 这 是 不 完整 的 规则 。 
































typedef enum { 


BLUE, 一 一 这 里 不 可 以 加 去 号 
} Color; 
现在 ， 一 般 称 为 ANSI C 的 C (ISO-IEC 9899-1990 )， 在 语法 上 是 不 允许 
写成 上 面 这 样 的 "。 可 是 在 ISO C99 中 ， 规 范 已 经 修改 成 可 以 在 最 后 的 元 素 后 
面 加 上 逗号 。 





6.2.9 结构 体 的 初始 化 
假设 有 下 面 这 样 一 个 结构 体 : 
typedef struct { 

int a; 
int b; 
} Hoge; 

写成 下 面 这 样 ， 可 以 初始 化 结构 体 的 内 容 : 

Hoge hoge = {5, 10}; 


在 结构 体 蝶 套 或 者 结构 体 中 包含 数组 的 时 候 


typedef struct { 








int a[10] ; 
Hoge hoge; 
} Piyo; 


只 要 能 够 像 下面 这 样 ， 很 好 地 将 各 成 员 的 内 容 一 一 对 应 ， 也 可 以 完成 初始 化 : 





Piyo piyo = { 
{0， 工 ， 25 35 4， 5 ， 6， 7， 8， 9},， 
{1， 2}, 


6.2.10 ”共用 体 的 初始 化 


共用 体 的 初始 化 比较 麻烦 。 因 为 编译 器 无 法 知道 “ 想 要 初始 化 哪 一 个 


O 





成 


3 





GD http://www.lysator.liu.se/c/rat/c5.html#3-5-7 
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在 ANSIC 中 , 共用 体 的 初始 化 是 针对 第 一 个 成 员 实 施 的 , 这 还 真是 个 奇 
怪 的 规则 呢 ! 但 是 对 于 C 的 语法 来 说 ， 这 也 是 迫不得已 的 决定 。 


typedef union { 




















int int_value; 
char *Str; 
} Hoge; 
Hoge hoge = {5}; 一 一 初始 化 表达 式 对 应 于 int_value 


6.2.11 全 局 变量 的 声明 
在 使 用 C 的 全 局 变量 的 时 候 ， 简 单 地 在 头 文 件 中 像 下 面 这 样 进行 声明 : 


int global_variable; 


然后 可 以 在 使 用 它 的 (多 个 的 ) .c 文件 中 将 其 #include。 这 种 用 法 是 比 
较 常 见 的 。 


可 是 ， 本 来 应 该 在 整个 程序 的 某 一 个 地 方 定 义 全 局 变量 ， 其 他 地 方 使 用 
extern 声明 就 可 以 了 。 


虽说 如 此 , 但 是 现在 的 大 部 分 (UNIX 的) C 处 理 环境 中 ， 对 于 在 多 个 地 
方 进行 全 局 变量 的 定义 ， 编 译 器 是 不 会 提出 任何 警告 的 ， 这 不 能 不 说 是 C 的 
一 个 缺陷 。 在 多 个 地 方 进 行 不 加 extern 的 变量 定义 , 本 来 在 连接 的 时 候 就 应 
该 报 出 多 重 定义 (multiple define ) 的 错误 。 


大 型 的 应 用 程序 ， 会 有 很 多 人 同时 参与 开发 。 这 种 情况 下 ， 对 于 偶尔 出 
现 的 全 局 变量 名 称 冲 突 的 情况 ,如 今 的 UNIX 的 处 理 环 境 是 不 会 提出 任何 警告 
的 。 最 终 的 结果 就 是 ， 大 家 总 是 被 “全 局 变量 的 值 总 是 在 不 知 不 觉 中 被 修改 ” 
这 样 的 性 质 极 其 恶劣 的 bug 所 困扰 。 


当然 ， 在 大 型 应 用 程序 开发 中 ， 建 立 全 局 变量 命名 规则 是 一 个 常识 。 但 
是 运用 规则 的 也 是 人 ， 所 以 出 现 玻 漏 也 是 不 可 避免 的 。 所 以 应 该 通过 一 些 工 
有 具 去 机 械 地 检查 全 局 变量 的 命名 状况 。 


这 里 说 一 个 题 外 话 。 我 经 常 看 到 某 些 开发 工程 中 对 函数 名 使 用 了 命名 规 
则 ， 却 将 全 局 变量 命名 规则 的 制定 和 实施 放 在 一 边 。 对 函数 名 使 用 命名 规则 ， 
这 自然 是 件 好 事 。 但 如 果 函 数 名 出 现 冲 突 ， 在 连接 的 阶段 ， 毕 竟 处 理 环境 是 
会 报错 的 。 因 此 从 危险 性 上 来 说 ， 全 局 变量 名 称 的 问题 应 该 更 多 地 引起 大 家 
的 重视 。 
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顺便 说 一 下 , C++ 已 经 消除 了 这 个 缺陷 。 如 果 在 多 个 地 方 定 义 没有 extern 
的 变量 会 被 报错 。 


在 第 5 章 的 word_count 程序 中 ， 头 文件 word manage _p.h 里 使 用 了 
extern 声明 了 全 局 变量 ， 然 后 在 initialize.c 中 对 它们 进行 了 定义 。 


可 是 ， 在 两 个 不 同 地 方 进行 几乎 完全 相同 的 记述 ， 这 很 容易 成 为 错误 的 
根源 。 可 以 使 用 下 面 的 方法 来 解决 这 个 问题 ， 


#ifdef GLOBAL_VARIABLE_DEFINE 
#define GLOBAL /x 定义 "无 "” */ 
#else 

#define GLOBAL extern 

#endif /x GLOBAL_VARIABLE_DEFINE */ 








GLOBAL int global_variable; 


将 头 文件 写成 上 面 这 样 ， 然 后 在 程序 的 某 一 个 地 方 使 用 #define 定义 
GLOBAL_VARIABLE_DEFINE, 并 且 包 含 这 个 头 文件 , 就 能 保证 定义 只 存在 于 一 
个 地 方 ， 其 他 地 方 都 是 extern。 


使 用 了 这 个 技巧 ， 就 无 法 使 用 初始 化 表达 式 ， 所 以 很 多 人 并 不 喜欢 运用 
这 个 技巧 。 对 于 全 局 变量 ， 我 自己 是 很 少 使 用 初始 化 表达 式 的 。 因 为 初始 化 
表达 式 “ 只 能 发 生 一 次 作用 ”， 所 以 我 习惯 写 一 个 像 第 5 章 例 题 中 
word_initialize0O) 这 样 的 函数 。 


但 是 我 们 经 常 需要 对 数组 进行 初始 化 ， 这 种 情况 下 ， 可 以 使 用 下 面 的 方 
式 : 



































GLOBAL char *color_name[] 
#ifdef GLOBAL_VARIABLE_DEFINE 
= { 

"red", 

"green", 

"blue", 


#endif /* GLOBAL_VARIABLE_DEFINE */ 
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